未知の力学系における一般化された情報収集フレームワーク
TL;DR未知の力学系で動作するエージェントが、観測から効率的に力学を学習するための統一的なフレームワークを提案した研究である。パラメータ、信念、制御の因果関係を明示することで、特定のモデル選択に依存しない一般的な情報収集コストを導出した。
AI研究の要点を整理。最新の論文記事をカテゴリやタグで探索できます。
運営: Cognitive Research Labs(CRL) / crl.co.jp
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
Cog AI Archive
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
TL;DR未知の力学系で動作するエージェントが、観測から効率的に力学を学習するための統一的なフレームワークを提案した研究である。パラメータ、信念、制御の因果関係を明示することで、特定のモデル選択に依存しない一般的な情報収集コストを導出した。
TL;DR布の操作は高次元の状態空間や複雑な動力学により困難な課題ですが、本研究は知覚と推論を分離するモジュール型アプローチを提案します。強化学習においてモデルサイズと学習時間を大幅に削減し、SoftGymベンチマークで既存手法を上回る性能を達成しました。シミュレーションで学習したモデルの実世界への転用も実証しています。
TL;DREmboCoach-Benchは、LLMエージェントがロボットの制御ポリシーを自律的に設計・最適化する能力を評価するベンチマークです。32種類のタスクを通じ、コード生成からデバッグ、環境フィードバックを用いた反復的な改善までを検証します。
TL;DREmboCoach-Benchは、LLMエージェントが自律的にロボットの制御ポリシーを構築する能力を評価するベンチマークです。32種類のタスクを通じて、コード生成からデバッグ、報酬設計、最適化までの閉ループなワークフローを検証します。AIが人間による基準を26.
TL;DR本研究は、エアホッケーのような高速な判断が求められる課題に対し、混合信号アナログ/デジタルニューロモーフィックプロセッサ上のスパイキングニューラルネットワークを用いた制御手法を提案します。局所的な学習ルールであるe-propと強化学習を組み合わせることで、極めて少ない試行回数でリアルタイムな学習と高速なロボット制御を実現しました。
TL;DR本研究は、混合信号アナログ・デジタルニューロモーフィックプロセッサを用い、高速なエアホッケーロボットを制御するスパイクニューラルネットワークを提案します。固定されたランダム結合と局所的な学習則を組み合わせることで、極めて少ない試行回数での強化学習を実現しました。
TL;DRエンボディドエージェントのメモリ制約問題に対し、MLLMを用いたオンラインメモリ剪定フレームワーク「MemCtrl」を提案。探索中に観測や内省を保持・更新・破棄すべきかを判断する学習可能なメモリヘッド$μ$を追加。EmbodiedBenchでの評価において、平均約16%、特定の指示セットでは20%以上のタスク完了能力の向上を確認した。
TL;DR自動運転における認識と軌跡予測のための新たなエンドツーエンドモデル「Li-ViP3D++」が提案された。カメラとLiDARを統合する新手法「QGDF」を導入し、クエリ空間での適応的な情報融合を実現。nuScenesデータセットにおいて、従来モデルより高い認識精度と予測性能を達成しつつ、処理速度も向上させた。
TL;DR本研究では、大規模言語モデル(LLM)エージェントをロボット操作に直接適用する「FAEA」を提案しています。ソフトウェア開発用の既存エージェントフレームワークを変更なしで使用し、デモやファインチューニングを必要とせずに、LIBERO等のベンチマークで約85-96%の高い成功率を達成しました。これにより、新たな訓練データの自律生成への道が開かれました。
TL;DRHARMONIは、大規模言語モデル(LLM)を活用し、社会的支援ロボットが長期間のマルチユーザー対話を管理するためのフレームワークです。話者識別、環境理解、ユーザーモデリング、応答生成の4つのモジュールを統合し、高齢者施設での実証実験を通じて、ベースラインよりも高い個別化精度とユーザー満足度を実証しました。
Pricing