長文のみ | Cog AI Archive

AI研究 2026-02-04 長文

CUBO：16GB RAMの一般向けノートPCで動作する自己完結型RAGプラットフォーム

CUBOは、16GBの共有メモリを搭載した一般的なノートPCで動作するように設計された、自己完結型の検索拡張生成（RAG）プラットフォームであり、クラウドベースのAIが抱えるGDPR違反のリスクを回避しつつ、通常は18〜32GBのRAMを必要とするローカルRAGシステムを、15.

7010 字

読む →

AI研究 2026-02-04 長文

AOrchestra：サブエージェントを“その場で作る”指揮者が、長いタスクを強くする

複雑で長いタスクほど、なぜエージェントは途中で失速してしまうのでしょうか？原因はモデルの賢さだけでなく、「サブエージェントをどう扱うか」の設計にある――論文はそう示唆します。この記事では、AOrchestraが提案する“動的に作れるサブエージェント”という発想と、何がどこまで良くなったのかを追います。

7318 字

読む →

AI研究 2026-02-04 長文

「エージェントを増やしても伸びない」理由を、多様性から解き明かす

エージェントを16人に増やせば、LLMはもっと賢くなるはず……本当に？直感的には“人手”が増えるほど強くなりそうですが、意外にも、同じようなエージェントを増やすほど伸びが止まり、「多様性」だけが伸びしろを残します。

7564 字

読む →

AI研究 2026-02-04 長文

管内データで束ねた燃料集合体の限界熱流束を当てにいく：CTF×ハイブリッド機械学習の一般化検証

管（チューブ）で学習したモデルは、燃料棒が束になった「ロッドバンドル」でも通用するのか？意外なのは、複雑さが一気に増えるのに「追加データが足りない」という現実が、手法の選び方だけでなく、“勝ち筋の描き方”そのものを変えさせる点です。

8097 字

読む →

AI研究 2026-02-04 長文

オンラインとオフラインの“いいとこ取り”：マルチターンコード生成をコンテキスト付きバンディットで学習する

マルチターンでコードを書き直すLLMは、どうすれば「強く」かつ「安く」育てられる？オンラインRLが強いのは分かる。でも高コストで不安定——そこで発想を変える。この記事では、COBALTが“マルチターン”を“一手ずつ”に分解して橋をかけた狙いと手触りを追う。

9469 字

読む →

AI研究 2026-02-04 長文

反蒸留フィンガープリンティング

大規模言語モデル（LLM）の出力を無断で学習して模倣する「モデル蒸留」を検知するため、生徒モデルの学習力学に適合した信号を埋め込む新手法「ADFP」が提案されました。従来のウォーターマーク手法は生成品質を大幅に低下させる課題がありましたが、ADFPはプロキシモデルを用いて検知可能性を最大化するトークンを動的に選択することで、品質維持と強力な検知能力を両立します。数学的推論（GSM8K）や対話タスク（OASST1）の検証において、生徒モデルの構造が未知であっても、従来手法を凌駕する精度で蒸留の有無を判定できることが実証されました。

7835 字

読む →

AI研究 2026-02-04 長文

計算予算の中で「推論の誤り率」を握る——Conformal Thinkingという発想

推論LLMは、どこまで考えさせれば“十分”なのでしょうか？実は「トークン数を決める問題」は、しきい値を決める問題に姿を変えるだけで、悩みは残ります。この記事では、計算予算の設定を“リスク（誤り率）制御”に言い換える論文の狙いと仕組みを追います。

7619 字

読む →

AI研究 2026-02-04 長文

視覚トークンを“間引いても崩れない”——マルチモーダルLLM学習を速くするDualSpeed

マルチモーダルLLMは、なぜ「学習」だけがこんなに重くなりがちなのでしょうか？鍵はモデルの巨大さだけでなく、画像が生む“視覚トークンの多さ”にあります。とはいえ、ただ削れば速くなる一方で、推論の場面で別の問題が噴き出す——そこが話を難しくします。

7488 字

読む →

AI研究 2026-02-04 長文

音声と「場所・季節」を賢く足し合わせる：適応的な証拠重み付けによる融合 FINCH

同じ正解にたどり着く手がかりが、複数あるとき——私たちはどう「足し合わせる」のが正解なのでしょうか？単純に混ぜれば強くなる、とは限りません。状況によっては、弱い手がかりが全体を壊してしまうからです。

7216 字

読む →

AI研究 2026-02-04 長文

緊急停止だけで賢くする：不完全な介入信号から学ぶ「残差」微調整

「危ない！」という緊急停止（e-stop）しか手がかりがないとき、ロボットは本当に上達できる？しかも現場で起きるのは、丁寧な指示や正解例ではなく、とっさの停止や介入であることが多いはずです。実は、“止められないようにする”だけでは、うまくいくとは限りません。

8087 字

読む →

生成AI研究を、要点から追う。

最新の記事

CUBO：16GB RAMの一般向けノートPCで動作する自己完結型RAGプラットフォーム

AOrchestra：サブエージェントを“その場で作る”指揮者が、長いタスクを強くする

「エージェントを増やしても伸びない」理由を、多様性から解き明かす

管内データで束ねた燃料集合体の限界熱流束を当てにいく：CTF×ハイブリッド機械学習の一般化検証

オンラインとオフラインの“いいとこ取り”：マルチターンコード生成をコンテキスト付きバンディットで学習する

反蒸留フィンガープリンティング

計算予算の中で「推論の誤り率」を握る——Conformal Thinkingという発想

視覚トークンを“間引いても崩れない”——マルチモーダルLLM学習を速くするDualSpeed

音声と「場所・季節」を賢く足し合わせる：適応的な証拠重み付けによる融合 FINCH

緊急停止だけで賢くする：不完全な介入信号から学ぶ「残差」微調整