継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

未知の力学系における一般化された情報収集フレームワーク

未知の力学系で作動するエージェントが、特定のモデルや更新手法に依存せずに効率的な学習を行うための、因果関係を明示した一般化された情報収集フレームワークを提案しています。この枠組みは、パラメータ、信念、制御、状態、観測の間の複雑な依存関係を因果グラフによって整理し、学習と計画のプロセスを完全に分離して設計することを可能にします。 マッセイの有向情報量に基づいた新しいコスト関数を導入し、従来の相互情報量を用いる手法が特定の条件下における特殊なケースであることを数学的に証明することで、既存手法に理論的な正当性を与えました。これにより、ガウス過程やニューラルネットワークなど、異なるモデル構造を採用した場合でも、統一的な数理基盤の上で最適な情報収集行動を導出できます。 この枠組みは、線形・非線形システムやマルチエージェント環境において、学習アルゴリズムと計画アルゴリズムを柔軟に組み合わせることを可能にし、未知の他者に関する情報の能動的な取得を容易にします。実験では、自律走行車が他者の意図を推定するシナリオなどを通じて、提案手法が多様なタスクにおいて一貫した性能を発揮し、システムの安全性を高めることを実証しました。

6824 字
読む →

ドリフトするMDPの幾何学:経路積分による安定性証明

現実世界の強化学習における非定常性を、報酬や遷移ダイナミクスが連続的に変化する微分可能なホモトピー経路としてモデル化し、最適ベルマン固定点の移動を幾何学的に追跡する新しい理論的枠組みを提案しています。

6677 字
読む →

Liquid Interfaces:自律システムのための動的オントロジー

従来のソフトウェア開発における静的なAPI契約と、柔軟に適応する自律型AIエージェントの間にある「存在論的な不一致」を解消するため、実行時に動的に生成され、役割を終えると消滅する「リキッド・インターフェース」という新しい調整パラダイムが提案されました。

6408 字
読む →

異種コンピューティング:AIエージェント推論の未来を支える鍵

AIエージェントの普及により推論負荷が急増しており、従来のGPU中心の均一なインフラではメモリ帯域幅と容量の限界(メモリの壁)に直面するため、計算・ネットワーク・メモリの全域にわたるシステムレベルの異種(ヘテロジニアス)構成への移行が不可欠である。

6389 字
読む →

MEIDNet: マルチモーダル生成AIによる材料の逆設計フレームワーク

MEIDNetは、結晶構造、電子状態(バンドギャップ)、熱力学的性質(生成エンタルピー)の3つの異なるモダリティを統合して学習する、マルチモーダルな材料逆設計フレームワークである。等変グラフニューラルネットワーク(EGNN)と対照学習を組み合わせることで、従来の学習手法よりも約60倍高い効率を実現し、潜在空間において0.96という極めて高い類似度での整列を達成した。このモデルを用いて低バンドギャップのペロブスカイト構造を生成した結果、既存のデータベースにない安定かつ新規な材料を13.6%という高い成功率(SUN率)で発見することに成功し、YbScSe₃やKTaSe₃といった有望な新物質を特定した。

5779 字
読む →

SymbXRL:モバイルネットワーク向け深層強化学習の意思決定を記号AIで解明する

将来の6Gネットワーク管理において不可欠な深層強化学習(DRL)は、意思決定プロセスが不透明な「ブラックボックス」であるため、実際の運用現場への導入が困難という課題がある。 本研究が提案する「SymbXRL」は、一階述語論理(FOL)という記号AIの手法を用いて、DRLの複雑な数値データを人間が理解可能な記号や論理規則に変換し、直感的な説明とナレッジグラフを生成する。 実証実験では、ネットワークスライシングとMassive MIMOの制御において、既存手法を上回る解釈性を提供し、意図に基づく行動制御によって累積報酬を中央値で12%向上させることに成功した。

5784 字
読む →

「より良い」プロンプトが逆効果になる時:LLMアプリのための評価主導型反復プロセス

LLMの出力は非決定論的でモデル更新に敏感なため、従来の決定論的なテスト手法では不十分であり、「定義・テスト・診断・修正」の4フェーズからなる評価主導型の反復ワークフローを導入することで、場当たり的な調整から再現可能なエンジニアリングプロセスへの転換を提案する。

6237 字
読む →

CAR-bench:実世界の不確実性下におけるLLMエージェントの一貫性と限界認識を評価するベンチマーク

CAR-benchは、車載アシスタントという実世界の不確実な環境において、LLMエージェントの一貫性、不確実性への対処、および自身の能力限界の認識能力を評価するための新しいベンチマークである。従来のタスク完了重視の評価とは異なり、必要なツールや情報が欠落している場合に嘘をつかずに限界を認める「Hallucinationタスク」と、曖昧な要求を対話や内部検索で解消する「Disambiguationタスク」を導入している。最新の推論モデルを含む評価の結果、一度の成功(Pass@3)と常に成功すること(Pass^3)の間には大きな乖離があり、特に曖昧さの解消においては一貫した成功率が50%を下回るなど、実用化に向けた信頼性の課題が浮き彫りになった。エージェントが「何ができるか」だけでなく「何ができないか」を正しく認識することの重要性を、本ベンチマークは定量的に示している。

5811 字
読む →

メタツールによるエージェントワークフローの最適化

エージェント型AIは大規模言語モデル(LLM)が推論とツール実行を繰り返すことで複雑な課題を解決しますが、反復的な推論ステップが過剰な運用コストや遅延、ハルシネーションによる失敗を招くという課題があります。

6013 字
読む →

モダリティを越えたコミュニケーションの学習:マルチエージェントシステムにおける知覚的異質性

本研究は、送信者が「音声」を聞き、受信者が「画像」を見るという、互いに異なる知覚モダリティ(感覚器)を持つ異種マルチエージェント間において、共通の知覚基盤がない状態からどのようにコミュニケーションが創発するかを調査したものです。

6586 字
読む →