エージェント型AIは大規模言語モデル(LLM)が推論とツール実行を繰り返すことで複雑な課題を解決しますが、反復的な推論ステップが過剰な運用コストや遅延、ハルシネーションによる失敗を招くという課題があります。
エージェント型AIは大規模言語モデル(LLM)が推論とツール実行を繰り返すことで複雑な課題を解決しますが、反復的な推論ステップが過剰な運用コストや遅延、ハルシネーションによる失敗を招くという課題があります。 本研究が提案する「Agent Workflow Optimization(AWO)」は、既存の実行ログから頻出するツールの呼び出しパターンを特定し、それらを「メタツール」として一つの確定的な複合ツールに統合することで、不要な中間推論を省略し効率化を図ります。 検証の結果、AWOの導入によってLLMの呼び出し回数を最大11.9%削減し、さらにタスクの成功率を最大4.2ポイント向上させることに成功しており、効率性と堅牢性の両面でエージェントの性能を改善できることが示されました。
現代のエージェント型AIは、大規模言語モデル(LLM)を意思決定の核とし、外部環境と相互作用するためのツール呼び出しやメモリ保持、反復的な推論を組み合わせることで、最小限の人間による介入で複雑なタスクを解決する強力なパラダイムとなっています。 この柔軟性により、ソフトウェアエンジニアリングやウェブベースのタスク自動化、カスタマーサポートなど、多岐にわたる分野での活用が進んでいますが、実用化にあたっては深刻な運用上の課題が浮き彫りになっています。 特に、エージェントが「推論」と「行動」を交互に繰り返すReAct(Reasoning and Acting)ループにおいては、一つのタスクを完了するためにLLMを何度も呼び出す必要があり、これが推論コストの増大とエンドツーエンドの遅延を引き起こします。 例えば、音楽配信サービスのAPIを利用してプレイリストを作成し曲を追加する場合、認証、作成、追加といった複数のステップを逐次的に実行しなければならず、そのたびにLLMが介在することで計算資源が浪費されます。…
本論文では、エージェント型ワークフローの効率性、有用性、および実行コストを改善するための汎用的なフレームワークである「Agent Workflow Optimization(AWO)」を提案しています。 AWOの核心的なアイデアは、エージェントの実行軌跡(トラジェトリ)に含まれる構造的なツール呼び出しのパターンを特定し、それらを「メタツール」として統合することにあります。 メタツールとは、複数のエージェントのアクションを一つの呼び出しにまとめた確定的な複合ツールのことであり、これを利用することで、本来必要だった中間的なLLMの推論ステップをバイパスすることが可能になります。 このアプローチにより、エージェントは高レベルなワークフローの構成能力を維持したまま、ルーチン化されたサブタスクを効率的に実行できるようになり、推論コストと遅延の両方を削減できます。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related