継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

視覚・言語・行動の整合性のためのスケーリング検証:ポリシー学習のスケーリングを超える効果の立証

汎用ロボットの実現を阻む「意図と行動のギャップ」を解消するため、本研究はポリシー学習の強化ではなく、推論時の検証(テスト時スケーリング)を拡張する新フレームワーク「CoVer-VLA」を提案しました。

5769 字
読む →

データに潜む“サブリミナル効果”:ログ線形性で読む一般メカニズム

データのどこにも書いていないはずの性格や言語が、なぜ学習後のモデルに現れるのでしょうか? 論文はその現象を「特別な細工」ではなく、もっと一般的に起こりうる仕組みとして捉え直します。 この記事では、Logit-Linear Selection(LLS)が何をして、何が確かめられ、どこまで言えるのかを筋道立てて整理します。

7213 字
読む →

IoTモデルを変化に強くする:コントラスト継続学習(CCL)の整理と設計指針

IoTの現場で、学習済みモデルは“いつまで”通用するのでしょうか? 鍵は高性能な一発学習ではなく、変化に追従しつつ忘れにくい「学び方」でした。 この記事では、IoT向けのコントラスト継続学習(CCL)を、設計と運用の両面から読み解きます。

8586 字
読む →

壊れていても、進み続ける:身体性とタスクを条件とした拡散ポリシーによるフェイルアクティブな軌道生成

ロボットの関節故障(可動域制限やロック)が発生した際、システムを停止させずにタスクを継続する「フェイルアクティブ」な動作を実現するため、拡散モデルを用いた軌道生成フレームワーク「DEFT」を提案しました。

6276 字
読む →

ペアワイズ選好を用いた言語モデルベンチマークのアライメント手法

現在の言語モデル評価用ベンチマークは、モデルの潜在的な能力を測定できても、実際の利用環境における人間の好みや実用的な有用性を正確に予測できないという「評価の乖離」に直面していますが、本研究はこの課題を解決するために、外部の選好順位に基づいてベンチマークを自動的に調整する「ベンチマーク・アライメント」という新しい概念を提唱しました。 提案手法である「BenchAlign」は、モデル間のペアワイズな選好(どちらが優れているか)を学習することで、ベンチマーク内の膨大な質問項目に対して最適な重み付けを動的に割り当て、未知のモデルに対しても人間の価値観に沿った正確なランキングを生成することを可能にします。 実験では、小規模なモデルのデータのみで学習した場合でも、700億パラメータを超える巨大な未知のモデルの順位を極めて高い精度で予測できることが示され、既存のベンチマーク蒸留手法を圧倒する汎用性と、どの質問が評価に重要であるかを可視化できる優れた解釈性を実証しました。

6524 字
読む →

オフライン強化学習のための多様体制約付きエネルギーベース遷移モデル(MC-ETM)

オフライン強化学習における分布シフトと価値の過大評価を解決するため、多様体制約付きエネルギーベース遷移モデル(MC-ETM)が提案され、低次元多様体近傍での負例生成によりエネルギー地形を鋭敏化し、分布外への逸脱を正確に検知する手法が確立されました。

5792 字
読む →

交通協調のための時空間ディシジョン・トランスフォーマー

都市部の交通信号制御を「条件付きシーケンス生成問題」として再定義し、グラフアテンションによる空間協調と時系列トランスフォーマーを統合した新アーキテクチャ「MADT」を提案した。 従来の強化学習のような膨大な試行錯誤を必要とせず、オフラインの履歴データから学習が可能であり、目標とする報酬(Return-to-go)を指定することで、状況に応じた柔軟かつ効率的な信号制御を実現する。 アトランタやボストンの実データを用いた検証では、既存の最先端手法と比較して平均旅行時間を5〜6%短縮し、隣接する交差点間での高度な協調(グリーンウェーブ)を達成できることを証明した。

5640 字
読む →

FIRE-Bench: 科学的知見の再発見を通じたエージェント評価ベンチマーク

大規模言語モデル(LLM)を基盤とした自律型エージェントは、文献の調査から仮説の立案、実験の実施、データ分析に至る科学的研究の全工程を自動化し、発見の速度を劇的に向上させることが期待されています。

6271 字
読む →

DeltaEvolve:モメンタム駆動型進化による科学的発見の加速

大規模言語モデル(LLM)を用いた従来の進化型エージェントは、過去の全コード履歴をコンテキストに詰め込むため、トークン消費が膨大になり、重要なアルゴリズムの核となるアイデアが実装の詳細に埋もれてしまうという課題を抱えていた。

5773 字
読む →

特徴空間内における類似検索を用いた異常検知の決定境界の精緻化

本研究では、スパース制約、アテンション機構、敵対的学習を統合した深層学習モデル「SDA²E」を開発し、サイバーセキュリティ等の極めて不均衡なデータから異常を識別する頑健な潜在表現の獲得に成功した。

5657 字
読む →