論文検索 新着 人気
毎日更新
AI Data Base

生成AIの最新動向を、読みやすいアーカイブで。

AI研究の要点を整理。最新の論文記事をカテゴリやタグで探索できます。

新着 論文 人気 無料で試す
Popular

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

Cog AI Archive

最新の記事

人気記事ピックアップ

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

AI研究 2026-01-29 閲覧 20 クリック 11

未知の力学系における一般化された情報収集フレームワーク

TL;DR未知の力学系で動作するエージェントが、観測から効率的に力学を学習するための統一的なフレームワークを提案した研究である。パラメータ、信念、制御の因果関係を明示することで、特定のモデル選択に依存しない一般的な情報収集コストを導出した。

読了 0 分 1331 字
読む →

布操作学習における知覚と推論の分離によるデータ効率の向上

TL;DR布の操作は高次元の状態空間や複雑な動力学により困難な課題ですが、本研究は知覚と推論を分離するモジュール型アプローチを提案します。強化学習においてモデルサイズと学習時間を大幅に削減し、SoftGymベンチマークで既存手法を上回る性能を達成しました。シミュレーションで学習したモデルの実世界への転用も実証しています。

読了 0 分 1197 字
読む →

EmboCoach-Bench: 身体性AIエージェントの自律的なロボット開発能力を評価するベンチマーク

TL;DREmboCoach-Benchは、LLMエージェントがロボットの制御ポリシーを自律的に設計・最適化する能力を評価するベンチマークです。32種類のタスクを通じ、コード生成からデバッグ、環境フィードバックを用いた反復的な改善までを検証します。

読了 0 分 1308 字
読む →

EmboCoach-Bench: 具現化エージェント開発におけるAIエージェントの能力を評価するベンチマーク

TL;DREmboCoach-Benchは、LLMエージェントが自律的にロボットの制御ポリシーを構築する能力を評価するベンチマークです。32種類のタスクを通じて、コード生成からデバッグ、報酬設計、最適化までの閉ループなワークフローを検証します。AIが人間による基準を26.

読了 0 分 1309 字
読む →

低速なシリコンニューロンによる高速ロボット制御:スパイキング強化学習の活用

TL;DR本研究は、エアホッケーのような高速な判断が求められる課題に対し、混合信号アナログ/デジタルニューロモーフィックプロセッサ上のスパイキングニューラルネットワークを用いた制御手法を提案します。局所的な学習ルールであるe-propと強化学習を組み合わせることで、極めて少ない試行回数でリアルタイムな学習と高速なロボット制御を実現しました。

読了 0 分 1241 字
読む →

低速なシリコンニューロンで高速ロボットを制御するスパイク強化学習

TL;DR本研究は、混合信号アナログ・デジタルニューロモーフィックプロセッサを用い、高速なエアホッケーロボットを制御するスパイクニューラルネットワークを提案します。固定されたランダム結合と局所的な学習則を組み合わせることで、極めて少ない試行回数での強化学習を実現しました。

読了 0 分 1245 字
読む →

MemCtrl: MLLMを能動的メモリコントローラーとして活用するエンボディドエージェント向け新手法

TL;DRエンボディドエージェントのメモリ制約問題に対し、MLLMを用いたオンラインメモリ剪定フレームワーク「MemCtrl」を提案。探索中に観測や内省を保持・更新・破棄すべきかを判断する学習可能なメモリヘッド$μ$を追加。EmbodiedBenchでの評価において、平均約16%、特定の指示セットでは20%以上のタスク完了能力の向上を確認した。

読了 0 分 1563 字
読む →

Li-ViP3D++: クエリベースの変形可能フュージョンによるエンドツーエンドの認識と軌跡予測

TL;DR自動運転における認識と軌跡予測のための新たなエンドツーエンドモデル「Li-ViP3D++」が提案された。カメラとLiDARを統合する新手法「QGDF」を導入し、クエリ空間での適応的な情報融合を実現。nuScenesデータセットにおいて、従来モデルより高い認識精度と予測性能を達成しつつ、処理速度も向上させた。

読了 0 分 1446 字
読む →

LLMエージェントによる教示不要のロボット制御

TL;DR本研究では、大規模言語モデル(LLM)エージェントをロボット操作に直接適用する「FAEA」を提案しています。ソフトウェア開発用の既存エージェントフレームワークを変更なしで使用し、デモやファインチューニングを必要とせずに、LIBERO等のベンチマークで約85-96%の高い成功率を達成しました。これにより、新たな訓練データの自律生成への道が開かれました。

読了 0 分 1614 字
読む →

HARMONI:LLMを用いた多人数対ロボット相互作用のマルチモーダルなパーソナライズ

TL;DRHARMONIは、大規模言語モデル(LLM)を活用し、社会的支援ロボットが長期間のマルチユーザー対話を管理するためのフレームワークです。話者識別、環境理解、ユーザーモデリング、応答生成の4つのモジュールを統合し、高齢者施設での実証実験を通じて、ベースラインよりも高い個別化精度とユーザー満足度を実証しました。

読了 0 分 1282 字
読む →
保存済みの記事がまだありません。
読み込み中…

Pricing

論文×チャット×知識DBを続けるなら

Free

¥0
  • 要約閲覧
  • 全文は月 2 本まで
  • チャットは月 3 回まで
無料で始める

Plus

¥1,780 / 月
  • 全文閲覧無制限
  • スレッド保存
  • Flashモデル
  • チャット上限 300 回/月
Plusで始める

Pro

¥2,980 / 月
  • 全文閲覧無制限
  • スレッド保存
  • 長文回答(Proモデル)
  • チャット上限 800 回/月
Proで始める