継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

LLMエージェントによる教示不要のロボット制御

FAEA(Frontier Agent as Embodied Agent)は、ソフトウェア開発用に設計された汎用LLMエージェントであるClaude Agent SDKを、一切の変更を加えずそのままロボット操作に適用した手法であり、事前のデモンストレーションや追加学習を必要とせずに、試行錯誤を通じたプログラム合成によって自律的にタスクを遂行する。 LIBERO、ManiSkill3、MetaWorldという3つの主要なベンチマークにおいて、特権的な環境状態を利用することでそれぞれ84.9%、85.7%、96%という高い成功率を達成し、最大100件のデモンストレーションで学習した既存の視覚・言語・行動(VLA)モデルに匹敵、あるいはそれを上回る性能を示した。 この手法は、エージェントがシミュレーション内で自律的に成功軌道を生成できるため、ロボット学習のためのデータ拡張ツールとしての実用性が高く、汎用モデルの進化やエージェント基盤の改善がそのままロボット制御の向上に直結する新しいパラダイムを提示している。

5752 字
読む →

ホワイトペーパーの主張は市場の動きを予測できるか?仮想通貨の要因分析による検証

仮想通貨プロジェクトがホワイトペーパーで提示する技術的・機能的な物語(ナラティブ)と、実際の市場データから抽出された要因構造の間に、数学的な整合性が存在するかを自然言語処理とテンソル分解を用いて検証した。 分析の結果、ホワイトペーパーの主張と市場の潜在的要因の間には極めて弱い整合性(一致係数0.

5641 字
読む →

生成順序とトークン空間の同時探索による拡散言語モデルのデコーディング改善

拡散言語モデル(DLM)が持つ「生成順序に依存しない」という潜在的な利点を引き出すため、生成順序とトークンの値を同時に探索する新しいアルゴリズム「Order-Token Search」が提案されました。

7231 字
読む →

AutoGenを用いたマルチモーダル・マルチエージェント・ランサムウェア解析

現代の高度なランサムウェアに対抗するため、静的・動的・ネットワークの3つの情報を統合し、AutoGenを活用したマルチエージェント・フレームワーク「MMMA-RA」を提案する。 各モダリティに特化したエージェントがオートエンコーダーと対照学習を用いて特徴を抽出し、トランスフォーマー分類器とエージェント間のフィードバックにより、Macro-F1スコア0.936という高い精度でファミリーを特定する。 100エポックの試行でエージェントの品質が0.75以上向上し、信頼性を意識した棄権メカニズムの導入により、不確実な状況では保守的な判断を下すことで実運用における信頼性を確保した。

5682 字
読む →

TABED: LVLMにおける堅牢な推測デコーディングのためのテスト時適応アンサンブルドラフト

大規模視覚言語モデル(LVLM)の推論を大幅に加速させるため、複数のドラフトモデルをテスト時に動的に統合する新手法「TABED」が提案されました。従来の推測デコーディングでは、視覚情報の有無によって加速性能が不安定になる課題がありましたが、本手法は過去の検証結果から最適な重みを適応的に決定することで、多様なシナリオで一貫した高速化を実現します。追加の学習を一切必要としないプラグアンドプレイな設計でありながら、平均で1.74倍の速度向上を達成し、既存の単一ドラフト手法を5%以上上回る堅牢な性能を幅広いベンチマークで示しました。

5642 字
読む →

Transformerベースのモデルを用いたマルチエージェント軌道予測における教師なし異常検知

自動運転の安全性評価において、稀にしか発生しない危険なシナリオを効率的に特定するため、マルチエージェント間の複雑な相互作用を考慮できるTransformerベースの教師なし異常検知フレームワークを開発し、ラベルのない大規模な自然運転データから物理的な意味を持つリスクを抽出する手法を確立しました。

6001 字
読む →

ScatterFusion:強化された時系列予測のための階層的スキャタリング変換フレームワーク

ScatterFusionは、数学的に証明された安定性を持つウェーブレットスキャタリング変換と、現代的な階層的アテンション機構を統合することで、複雑な多スケールの時系列依存関係を正確に捉える新しい予測フレームワークである。

5733 字
読む →

概念成分分析(ConCA):LLMの内部表現から概念を抽出するための原理的アプローチ

大規模言語モデル(LLM)の内部表現を解釈する手法として、従来の稀な自己符号化器(SAE)が抱えていた理論的根拠の欠如という課題を解決するため、潜在変数モデルに基づいた新しい枠組みである概念成分分析(ConCA)が提案されました。

6527 字
読む →

Fair Recourse for All: 反実仮想説明における個人および集団の公平性の確保

機械学習の意思決定を説明する反実仮想説明(CF)において、似た属性の個人に同様の改善策を出す「個人の公平性」と、保護属性グループ間で機会を均等にする「集団の公平性」を両立する「ハイブリッド公平性」を定義した。

6296 字
読む →

CCMamba: 組み合わせ複体の高次グラフ学習に向けた選択的状態空間モデル

現実世界の複雑なデータ構造を扱うため、グラフやハイパーグラフを包括する「組み合わせ複体」という統一的なトポロジカル枠組みを採用し、線形時間で動作する初のMambaベースの学習モデルであるCCMambaを提案した。

6206 字
読む →