継続更新

エージェント・プリミティブ:マルチエージェントシステムのための再利用可能な潜在的構成要素

従来のマルチエージェントシステム(MAS)が抱えていた、タスクごとに手動でプロンプトや役割を設計しなければならない構築コストの高さと、自然言語による通信が長文コンテキストやノイズによって劣化するという二つの根本的な課題を解決するため、ニューラルネットワークの構成要素に着想を得た「Agent Primitives」という再利用可能な潜在的構成ブロックが提案されました。 これは、Review(推敲)、Voting and Selection(投票と選択)、Planning and Execution(計画と実行)という、多くのシステムで共通して見られる計算パターンを抽象化したものであり、エージェント間の通信にテキストではなくキー・バリュー(KV)キャッシュを直接受け渡す潜在的通信を採用することで、情報の劣化を防ぎつつ処理の高速化を実現しています。 数学的推論やコード生成などのベンチマークを用いた検証の結果、単一エージェントと比較して平均精度が12.0〜16.5%向上し、従来のテキストベースのシステムよりもトークン使用量と推論遅延を3〜4倍削減することに成功したほか、長文の文脈における指示遵守率が自然言語通信の15.6%から73.3%へと劇的に改善されるなど、高い堅牢性が確認されました。

エージェント・プリミティブ:マルチエージェントシステムのための再利用可能な潜在的構成要素 の図解
論文図解

TL;DR(結論)

従来のマルチエージェントシステム(MAS)が抱えていた、タスクごとに手動でプロンプトや役割を設計しなければならない構築コストの高さと、自然言語による通信が長文コンテキストやノイズによって劣化するという二つの根本的な課題を解決するため、ニューラルネットワークの構成要素に着想を得た「Agent Primitives」という再利用可能な潜在的構成ブロックが提案されました。 これは、Review(推敲)、Voting and Selection(投票と選択)、Planning and Execution(計画と実行)という、多くのシステムで共通して見られる計算パターンを抽象化したものであり、エージェント間の通信にテキストではなくキー・バリュー(KV)キャッシュを直接受け渡す潜在的通信を採用することで、情報の劣化を防ぎつつ処理の高速化を実現しています。 数学的推論やコード生成などのベンチマークを用いた検証の結果、単一エージェントと比較して平均精度が12.0〜16.5%向上し、従来のテキストベースのシステムよりもトークン使用量と推論遅延を3〜4倍削減することに成功したほか、長文の文脈における指示遵守率が自然言語通信の15.6%から73.3%へと劇的に改善されるなど、高い堅牢性が確認されました。

なぜこの問題か

大規模言語モデル(LLM)を活用したマルチエージェントシステム(MAS)は、複雑な問題を複数のエージェントの協力によって解決する手法として非常に有望視されていますが、実用化にあたってはいくつかの深刻な障壁が存在しています。第一の課題は、システムの設計が極めてタスク固有であり、汎用性に欠ける点です。現在の多くのMASは、特定のタスクを解くためにエージェントの役割や相互作用のプロンプトを手作業で細かく定義しており、これがシステムの構築コストを増大させるだけでなく、異なるタスクへの再利用を困難にしています。タスクが複雑になればなるほど、設計の複雑さも指数関数的に増大し、モジュール化された抽象化が欠如しているために、過去の設計資産を有効に活用することができません。 第二の課題は、エージェント間の通信手段として主に用いられている自然言語の脆弱性です。自然言語による通信は人間にとっての解釈性は高いものの、エージェント間の多段階のやり取りや長文の文脈においては、情報の劣化やエラーの蓄積を招きやすいという欠点があります。…

核心:何を提案したのか

本研究では、複雑なニューラルネットワークがレジチュアルブロックやアテンションヘッドといった再利用可能なコンポーネントから構築されるのと同様の思想をマルチエージェントシステムに導入し、再利用可能な潜在的構成ブロックである「Agent Primitives」を提案しました。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む