AI研究 | Cog AI Archive

AI研究 2026-01-29

CTR予測における長短シーケンスモデリングのバランスをとるための長さ適応型興味ネットワーク

既存のクリック率（CTR）予測モデルにおいて、入力可能な行動履歴の長さを拡張すると、長期履歴を持つユーザーの精度は向上する一方で、短期履歴しか持たないユーザーの精度が逆に低下するという「長さの不均衡」による弊害が生じていることを明らかにした。

6065 字

読む →

AI研究 2026-01-29

意味的ガイダンスを通じたUI生成における隔たりの架橋

現在のテキストからUIを生成するAIシステムでは、ユーザーが自身のデザイン意図を言語化して伝えることが難しく、また生成された結果がなぜそのようになったのかを理解して修正することが困難であるという、実行と評価の両面における大きな隔たりが存在している。

5823 字

読む →

AI研究 2026-01-29

CollectiveKV：逐次推薦における協調情報の分離と共有

逐次推薦システムにおけるTransformerのKVキャッシュが引き起こす膨大なストレージ消費と推論遅延を解決するため、ユーザー間の協調情報を活用してキャッシュを劇的に圧縮する新手法「CollectiveKV」が提案されました。

6209 字

読む →

AI研究 2026-01-29

SECリスク予測のための先見学習

米国証券取引委員会（SEC）への提出書類に含まれる定性的なリスク情報を、将来の開示情報と自動的に紐付けることで、大規模な教師あり学習用データセットを構築する「LightningRod AI」パイプラインを提案した。

5949 字

読む →

AI研究 2026-01-29

SE-DiCoW：自己登録型ダイアライゼーション条件付きWhisper

複数話者が同時に発話する環境において、従来の話者属性付き音声認識（ASR）は、話者が完全に重なる区間で情報の曖昧さが生じ、特定の話者を正確に識別することが困難でした。本研究で提案されたSE-DiCoWは、会話全体から対象話者が最も活発な区間を自動的に特定して「自己登録セグメント」として抽出し、クロスアテンション機構を通じてモデルに条件付けを行うことで、この根本的な問題を解決します。この革新的な自己登録メカニズムと学習プロセスの改善により、EMMA MT-ASRベンチマークにおいて従来モデルからエラー率を相対的に52.4%削減し、実環境のデータセットにおいても最先端の性能を達成することに成功しました。

6095 字

読む →

AI研究 2026-01-29

RPO-RAG：ナレッジグラフ質問応答のための関係認識型選好最適化による小規模LLMのアライメント

大規模言語モデルが知識集約的なタスクで起こすハルシネーションを抑制するため、知識グラフ（KG）を活用したRAGにおいて、30億パラメータ未満の小規模モデルでも高精度な推論を可能にする新フレームワーク「RPO-RAG」が提案されました。

5911 字

読む →

AI研究 2026-01-29

VoxPrivacy：音声言語モデルの対話的プライバシーを評価するためのベンチマーク

音声言語モデル（SLM）がスマートホーム等の共有環境で、特定の利用者の機密情報を他者に漏洩させる「対話的プライバシー」の欠如を評価するための専用ベンチマーク「VoxPrivacy」が提案された。

6940 字

読む →

AI研究 2026-01-29

補助損失による分離型分割学習

従来の分割学習（Split Learning）が抱えていた、サーバーからの勾配返送待ちによる通信遅延と、バックプロパゲーションのための膨大なメモリ消費という二大課題を、分割点に軽量な補助分類器を導入して学習プロセスを「分離」することで根本から解決しました。

6258 字

読む →

AI研究 2026-01-29

空白は嘘をつかない：機械生成コード検出のための特徴駆動型および埋め込みベースのアプローチ

大規模言語モデル（LLM）の普及により、人間が書いたコードとAIが生成したコードを区別することが学術的誠実性や著作権の観点から急務となっています。本研究では、コードの空白や構造に着目した軽量で解釈可能な「特徴量ベース」の手法と、CodeBERTを用いた深い意味理解に基づく「埋め込みベース」の手法の2つを、60万件の大規模データセットを用いて比較検証しました。その結果、特徴量ベースの手法がROC-AUC 0.995という極めて高い性能を示し、特にインデントや空白のパターンがAIと人間を分ける強力な指標であることが判明した一方で、埋め込みベースの手法は高い精度（Precision）を維持するという、両者のトレードオフが明らかになりました。

5646 字

読む →

AI研究 2026-01-29

ソフトロボットを用いた触覚メモリ：マスク化エンコーディングとソフト手首による堅牢な物体挿入

物理的な柔軟性を備えたソフト手首と、過去の触覚体験をデータベース化して検索・再利用する機能を統合したロボットシステム「TaMeSo-bot」を開発し、位置の不確実性が高い環境下での堅牢なペグ挿入を実現しました。

5648 字

読む →

生成AI研究を、要点から追う。

最新の記事

CTR予測における長短シーケンスモデリングのバランスをとるための長さ適応型興味ネットワーク

意味的ガイダンスを通じたUI生成における隔たりの架橋

CollectiveKV：逐次推薦における協調情報の分離と共有

SECリスク予測のための先見学習

SE-DiCoW：自己登録型ダイアライゼーション条件付きWhisper

RPO-RAG：ナレッジグラフ質問応答のための関係認識型選好最適化による小規模LLMのアライメント

VoxPrivacy：音声言語モデルの対話的プライバシーを評価するためのベンチマーク

補助損失による分離型分割学習

空白は嘘をつかない：機械生成コード検出のための特徴駆動型および埋め込みベースのアプローチ

ソフトロボットを用いた触覚メモリ：マスク化エンコーディングとソフト手首による堅牢な物体挿入