継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

SIA: ネットワーク制御における予測型深層強化学習のための記号的解釈可能性

SIAは、予測情報を活用する深層強化学習(DRL)エージェントの意思決定プロセスをリアルタイムで可視化し、人間が理解可能な形式で解釈可能にする新しいフレームワークである。記号的AIの抽象化概念とKPIごとの独立した知識グラフを融合することで、現在の観測データと将来の予測データが行動に与える影響を個別に分離して評価する「影響スコア(IS)」を導入し、既存手法より200倍以上の高速化を達成した。ビデオストリーミングやRANスライシングなどの検証において、エージェントの設計ミスを特定してビットレートを9%向上させ、さらに再学習なしで報酬を25%改善することに成功し、予測型制御の信頼性と性能を大幅に高めている。

6434 字
読む →

識別器駆動型拡散モデルによる教師なし分解と再結合

複雑なデータを教師なしで背景、照明、物体の属性、あるいはロボットの動作といった独立した構成要素へと分解し、それらを自在に再結合して新たなサンプルを合成する手法を提案する。本研究では拡散モデルを基盤とし、要素レベルの教師信号を一切必要とせずに、再利用可能な構成要素を抽出する能力を持つ因子化された潜在空間の学習を実現している。 学習過程において、単一のデータ源から生成されたサンプルと、複数のデータ源の構成要素を組み合わせて生成されたサンプルを判別する「識別器」を用いた敵対的学習シグナルを導入した。生成器がこの識別器を欺くように最適化されることで、再結合されたデータにおける物理的および意味的な一貫性が強化され、不自然なアーティファクトの抑制と高品質な合成が可能になる。 CelebA-HQ、Virtual KITTI、CLEVR、Falcor3Dといった画像データセットで、従来手法を上回るFIDスコアと高い解離性を達成した。さらに、ロボットのビデオ軌跡における動作要素の再結合という新しい応用を実証し、LIBEROベンチマークにおいて状態空間の探索範囲を大幅に拡大する多様なシーケンスの生成に成功した。

5764 字
読む →

Vision-DeepResearch:マルチモーダル大規模言語モデルにおけるDeepResearch能力の動機付け

既存のマルチモーダル大規模言語モデル(MLLM)は、外部ツールを用いた検索において、画像全体を一度に検索する単純な手法に頼っており、ノイズの多い現実の環境では必要な情報に辿り着けない「ヒット率」の問題や、推論の深さと検索の幅が不足しているという課題を抱えています。

6002 字
読む →

ECO: フル精度マスターウェイト不要の量子化トレーニング

大規模言語モデル(LLM)の学習において、メモリ消費の大きな要因となっていた高精度なマスターウェイトを完全に排除し、量子化されたパラメータのみで学習を可能にする「Error-Compensating Optimizer(ECO)」が提案されました。

6194 字
読む →

下流タスクのフィードバックを用いた価値ベースの事前学習

従来の自己教師あり学習は、次トークン予測などの固定された代理目的関数を最適化する「オープンループ」な仕組みであり、膨大な計算資源が必ずしも最終的に必要な下流タスクの能力向上に効率よく割り当てられないという課題を抱えていた。

5826 字
読む →

SINA:人工知能を用いた回路図画像からネットリストへの生成器

SINAは、回路図の画像からSPICE互換のネットリストを全自動で生成するオープンソースの革新的なパイプラインであり、深層学習と高度な画像処理技術を統合することで、従来の手法が抱えていた素子認識の誤りや複雑な接続推論の困難さといった課題を根本から解決することに成功した。

5903 字
読む →

SWE-Replay: ソフトウェアエンジニアリングエージェントのための効率的なテスト時スケーリング

SWE-Replayは、ソフトウェアエンジニアリング(SWE)タスクにおいて、過去の試行(軌跡)から重要な中間ステップを再利用することで、計算コストを抑えつつ性能を向上させる新しいテスト時スケーリング手法である。

6095 字
読む →

World of Workflows: 企業システムに世界モデルをもたらすためのベンチマーク

最先端の大規模言語モデル(LLM)は、一般的なタスクでは高い能力を示すものの、複雑な企業システム内では隠れたワークフローが引き起こす連鎖的な副作用を予測できず、制約違反を無意識に引き起こす「動態盲目(Dynamics Blindness)」の状態にあることが本研究で明らかになった。

6579 字
読む →

StepShield: 暴走エージェントへの介入は「いつ」すべきか

従来のAIエージェントの安全性評価は、実行完了後に「有害か否か」を判定する事後分析に依存しており、被害を未然に防ぐための「介入のタイミング」を評価できないという重大な欠陥がありました。本研究が提案する「StepShield」は、9,213件の軌跡データと新しい時間的指標(EIR等)を用い、違反が「いつ」検出されたかをステップ単位で評価する世界初のベンチマークであり、LLMベースの判定器が従来の静的解析より2.3倍高い早期介入能力を持つことを明らかにしました。この適時性の評価は、単なる安全性の向上に留まらず、監視コストを75%削減し、エンタープライズ規模で5年間に累計1億800万ドルの計算リソースを節約できるという、AI運用の経済的合理性を直接的に証明しています。

6101 字
読む →

質問しながら推論する:受動的な解決者から能動的な探求者へのLLMの変革

OpenAIのo1やDeepSeek-R1に代表される推論型モデルが、情報不足の状況でも強引に推論を進めてしまう「盲目的な自己思考」という課題に対し、本研究は能動的に質問を行うPIRフレームワークを提案しました。

6562 字
読む →