タグ: cs.CL | Cog AI Archive

AI研究 2026-02-01 長文

ASTRA：エージェント的軌跡と強化学習アリーナの自動合成

ASTRAは、ツール利用エージェントの訓練を完全に自動化するエンドツーエンドのフレームワークであり、大規模なデータ合成と検証可能な強化学習を統合することで、従来の手動介入や不確実なシミュレーション環境への依存を排除している。

7136 字

読む →

AI研究 2026-02-01 長文

深層再帰アテンション混合：潜在的推論にふさわしい注目を

従来の思考連鎖（CoT）が抱える離散的な言語化の制約と計算コストの問題を、深層再帰とアテンション混合を統合した「Dreamer」フレームワークによって、潜在空間での効率的な多段階推論へと転換し、モデルの表現力を大幅に向上させた。

7302 字

読む →

AI研究 2026-02-01

深層再帰的アテンション混合：潜在的推論に、それに値するアテンションを

従来の思考の連鎖（CoT）は自然言語による冗長な出力を必要とし、計算コストが高いという課題があったが、本研究ではモデルの深さ方向で再帰的に計算を行う「深層再帰（DR）」を用いることで、潜在空間内での効率的な推論を実現する新しいフレームワーク「Dreamer」を提案している。

5934 字

読む →

AI研究 2026-02-01

EC検索の関連性向上のための多角的思考と潜在的推論蒸留

ECサイトの検索における検索語と商品の関連性判定を劇的に改善するため、大規模言語モデル（LLM）に「ユーザー意図」「構造的分析」「ビジネスルール」という3つの異なる視点から思考の連鎖（CoT）を行わせる「MPCoT」フレームワークを開発しました。

5950 字

読む →

AI研究 2026-02-01

広く考え、速く動く：Eコマースの関連性に向けた多角的思考の連鎖からの潜在的推論蒸留

電子商取引（EC）における検索の関連性評価を劇的に向上させるため、大規模言語モデル（LLM）の高度な思考プロセスを軽量モデルに継承させる新しい学習フレームワークが提案されました。この手法では、単一の視点に頼る従来の思考の連鎖（CoT）の限界を克服するため、ユーザーの意図、商品の構造的分析、プラットフォーム固有のビジネスルールという三つの異なる視点から推論を行う「多角的思考の連鎖（MPCoT）」を導入しています。これにより、複雑なクエリや曖昧な検索ワードに対しても、人間のような深い理解に基づいた正確な判断が可能になりました。さらに、この高度な推論能力を「潜在推論知識蒸留（LRKD）」という技術を用いて、BERTなどの小型モデルに「潜在的な推論ベクトル」として移植することで、推論時の計算コストを抑えつつLLMに匹敵する精度を実現しています。実際のオンラインA/Bテストでは、数千万人のユーザーを抱える広告プラットフォームにおいて、収益指標であるRPMが1.42%向上し、クリック率やユーザー満足度も有意に改善するなど、実用性と商業的価値の両面で極めて高い成果が実証されました。

6540 字

読む →

AI研究 2026-02-01

意味内容がアルゴリズムの性能を決定する

大規模言語モデル（LLM）は、本来入力の意味に左右されないはずの「計数（カウント）」という基本的なアルゴリズムにおいて、対象が「都市名」か「化学物質名」かといった意味内容によって正解率が40%以上も変動するという深刻な脆弱性を抱えていることが判明しました。

5923 字

読む →

AI研究 2026-02-01

意味的内容がアルゴリズムの性能を決定する

大規模言語モデル（LLM）は、本来なら入力の意味に左右されないはずの計数のようなアルゴリズム的タスクにおいて、対象が「都市名」か「化学物質名」かといった意味的内容（セマンティック・クラス）によって正解率が40%以上も変動するという重大な脆弱性を持っていることが明らかになった。

6346 字

読む →

AI研究 2026-02-01

オーバースケーリングの呪いを打破する：並列思考の前に並列性を考える

大規模言語モデル（LLM）の推論において、複数の推論パスを並列生成して多数決で統合する「並列思考」は有効ですが、全データに一律の大規模な並列数（予算）を割り当てると、多くのサンプルで計算資源が無駄になる「オーバースケーリングの呪い」が発生します。

6188 字

読む →

AI研究 2026-02-01

オーバースケーリングの呪いを打破する：並列的思考の前に並列性を考える

大規模言語モデルの推論において、複数の回答を生成して統合する「並列的思考」は精度を向上させますが、全問題に一律の大きな並列度を割り当てると、簡単な問題などで計算資源が無駄になる「オーバースケーリングの呪い」が発生することを明らかにしました。

6273 字

読む →

AI研究 2026-02-01

ILRR: マスク型拡散言語モデルのための推論時ステアリング手法

離散拡散言語モデル（DLM）の生成プロセスを推論時に制御するための、学習を必要としない新しいフレームワーク「反復的潜在表現洗練（ILRR）」が提案されました。この手法は、生成中のシーケンスの内部活性化状態を、単一の参照シーケンスの活性化状態と動的に位置合わせすることで、特定の属性やスタイルを効果的に転送します。

6185 字

読む →

生成AI研究を、要点から追う。

最新の記事

ASTRA：エージェント的軌跡と強化学習アリーナの自動合成

深層再帰アテンション混合：潜在的推論にふさわしい注目を

深層再帰的アテンション混合：潜在的推論に、それに値するアテンションを

EC検索の関連性向上のための多角的思考と潜在的推論蒸留

広く考え、速く動く：Eコマースの関連性に向けた多角的思考の連鎖からの潜在的推論蒸留

意味内容がアルゴリズムの性能を決定する

意味的内容がアルゴリズムの性能を決定する

オーバースケーリングの呪いを打破する：並列思考の前に並列性を考える

オーバースケーリングの呪いを打破する：並列的思考の前に並列性を考える

ILRR: マスク型拡散言語モデルのための推論時ステアリング手法