継続更新

Self-Manager:長文の深掘り調査のための並列エージェントループ

長文の深掘り調査において、従来のエージェントが抱えていた文脈の線形な蓄積による情報の希釈や、逐次実行による処理の停滞という課題を解決するため、非同期かつ並列な実行を可能にする新しいアーキテクチャ「Self-Manager」が提案されました。

Self-Manager:長文の深掘り調査のための並列エージェントループ の図解
論文図解

TL;DR(結論)

長文の深掘り調査において、従来のエージェントが抱えていた文脈の線形な蓄積による情報の希釈や、逐次実行による処理の停滞という課題を解決するため、非同期かつ並列な実行を可能にする新しいアーキテクチャ「Self-Manager」が提案されました。 このシステムは、メインスレッドが複数のサブスレッドを動的に生成し、それぞれに独立した文脈ウィンドウを割り当てることで、情報の干渉を防ぎながら多角的な調査を同時に進めることができ、スレッド制御ブロック(TCB)を通じて自律的な管理を行います。 DeepResearch Benchを用いた検証では、既存の単一エージェントやワークフロー型のシステムを全ての指標で上回り、商用の最先端システムであるGeminiやOpenAIのDeep Researchとの性能差を大幅に縮小することに成功しました。

なぜこの問題か

AIエージェントによる長文の深掘り調査(Deep Research)は、人間にとっても非常に負荷の高い、多面的な調査と長期的な推論を必要とするタスクです。現在の解決策の多くは、あらかじめ定義された固定的なワークフローに基づくマルチエージェントシステムに依存していますが、これらは特定のシナリオ以外への汎用性が低く、導入コストが高いという問題を抱えています。一方で、特定のワークフローに縛られず、基本的なループを通じて適応的に反復する単一エージェントのパラダイムは、柔軟性と堅牢性の観点から非常に有望なアーキテクチャとされています。しかし、従来の単一エージェントが採用しているReActのような「思考・行動・観察」のループには、実行時間が長くなるにつれて文脈が線形に蓄積されていくという根本的な制約が存在します。 この線形な蓄積は、重要な情報の希釈を招き、長時間の実行を維持することを困難にします。エージェントが多くのツールを利用し、大量の情報を読み込むほど、初期に得た重要な指示や中間結果が埋もれてしまい、最終的なレポートの品質が低下するのです。…

核心:何を提案したのか

本論文では、非同期かつ並列な実行を可能にする単一エージェントのループ構造「Self-Manager」を提案しています。このアーキテクチャの核心は、コンピュータのオペレーティングシステムの概念をエージェント設計に取り入れた「スレッド」の導入にあります。ユーザーからのグローバルなタスクを直接処理する「メインスレッド」が、必要に応じて複数の「サブスレッド」を動的に生成し、複雑な問題を分解して並列に処理させることができます。これにより、エージェントは単なる作業者から、複数の作業を指揮するマネージャーへと進化します。 Self-Managerは主に3つの革新的な機能を備えています。第一に「非同期性」であり、サブスレッドの実行中にメインスレッドが停止することはなく、全体の進行が停滞しません。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む