継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

OffSeeker:ディープリサーチエージェントに必要なのはオンライン強化学習だけではない

現在の最先端なディープリサーチエージェントの開発において主流となっている、高額なAPI費用と学習の不安定さを伴うオンライン強化学習に依存せず、高品質なオフライン学習のみで高性能なモデルを構築できることを実証しました。

5734 字
読む →

面白いか説得力があるか、しかし両方ではない:LLMにおけるきめ細かな多概念制御の評価

大規模言語モデルにおいて、ユーモアや説得力といった特定の文体概念を0から4までの5段階で詳細に制御する能力を測定するための、新しい評価フレームワークが提案されました。 単一の概念を制御する場合には一定の精度で強弱の調整が可能ですが、二つの概念を同時に制御しようとすると、たとえそれらが理論的に独立した概念であっても、モデルの制御性能が著しく低下することが明らかになりました。 この研究は、現在のモデルが複数の文体次元を組み合わせて調整する「合成性」に根本的な課題を抱えていることを示しており、今後の多次元的な制御手法を開発・評価するための標準的な基盤を提供しています。

6611 字
読む →

ジャストインタイム強化学習:勾配更新なしのLLMエージェントにおける継続学習

大規模言語モデル(LLM)エージェントがデプロイ後に新しい環境へ適応できないという「重みの固定」問題を解決するため、勾配更新を一切行わずに推論時に方策を最適化する「Just-In-Time Reinforcement Learning(JitRL)」が提案されました。

6612 字
読む →

都市規模におけるスケーラブルな公共交通遅延予測:多解像度特徴量エンジニアリングとディープラーニングを用いた体系的アプローチ

都市全体の広大なバスネットワークを対象とした、極めてスケーラブルな遅延予測パイプラインを構築し、1,683個に及ぶ多解像度の時空間特徴量を自動生成した上で、適応型主成分分析(Adaptive PCA)を活用して情報の95%を保持しつつ83成分まで劇的に圧縮することに成功した。

5928 字
読む →

指示追従の解体:大規模言語モデルの指示遵守能力を詳細に評価するための新しいベンチマーク

大規模言語モデル(LLM)が複雑な指示をどの程度正確に守れるかを詳細に評価するため、新しいベンチマーク「MOSAIC」が開発されました。このフレームワークは、最大20個の実用的な制約を動的に組み合わせてデータセットを生成し、タスクの成否と指示の遵守能力を切り離して評価できる点が特徴です。

5748 字
読む →

脚式ロボットの状態推定のためのアテンションに基づくニューラル拡張カルマンフィルタ

脚式ロボットの歩行中に発生する「足の滑り」は、運動学的な仮定を崩し推定誤差を増大させる主因となるが、本研究では不変拡張カルマンフィルタ(InEKF)にアテンション機構を用いたニューラル補正器を統合した「AttenNKF」を提案した。

6379 字
読む →

FastInsight: グラフRAGのための融合演算子による高速かつ洞察に満ちた検索

従来のグラフRAG手法は、大規模言語モデル(LLM)による推論プロセスを検索の合間に挟み込むことで洞察を得ていたが、このアプローチは実行に数十秒を要するなど極めて低速であり、実用的な対話システムへの導入が困難であった。

6160 字
読む →

負債としての安定性:LLMにおける言語構造の体系的崩壊

大規模言語モデルの学習において、従来は最適化の必須条件とされていた「学習の安定性」が、実は生成される言語構造の体系的な崩壊を招く「負債」となり得ることを、理論的証明と実験的検証の両面から明らかにしました。

7638 字
読む →

常識的アブダクション論理のためのバランスの取れたニューロシンボリックアプローチ

大規模言語モデル(LLM)の柔軟な知識とロジックソルバーの厳密な推論を融合させ、問題文に明示されていない常識的な前提知識を動的に補完しながら推論を行う新手法「ARGOS」が開発されました。 この手法は、ロジックソルバーから得られる論理的基盤(バックボーン)をフィードバックとして活用し、LLMが不足している常識的な関係性を反復的に生成・検証することで、従来の演繹的手法では解決困難だった不完全な情報を含む問題に対応します。 複数の論理推論ベンチマークを用いた検証において、ARGOSは既存のニューラル手法やシンボリック手法を安定して上回る精度を達成し、人間のようなアブダクション(仮説生成)推論が複雑な論理課題の解決に極めて有効であることを実証しました。

5843 字
読む →

LTS-VoiceAgent:意味的トリガーと増分推論による効率的なストリーミング音声対話のための「聞く・考える・話す」フレームワーク

従来の音声エージェントが抱えていた「推論能力の不足」と「高い応答遅延」の二律背反を解消するため、意味の区切りを検知して思考を開始する「動的意味トリガー」と、思考と発話を並列化する「二重役割ストリームオーケストレーター」を導入したLTS-VoiceAgentフレームワークを提案しました。

6613 字
読む →