従来のAIエージェントが直面していた「未知の環境や変化するタスクへの適応不足」を解消するため、実行中にツールを自律的に生成・洗練・蓄積する「現場自己進化(In-Situ Self-Evolving)」という新しいパラダイムが提案されました。
従来のAIエージェントが直面していた「未知の環境や変化するタスクへの適応不足」を解消するため、実行中にツールを自律的に生成・洗練・蓄積する「現場自己進化(In-Situ Self-Evolving)」という新しいパラダイムが提案されました。このシステムは、Pythonベースのツールをその場で合成するマルチエージェント構成と、ツールの重複を防ぎつつ汎用性を高める「並列バッチ進化(Parallel Batch Evolution)」戦略により、外部の指導や正解ラベルがない環境でも能力を拡張し続けることが可能です。難関ベンチマークを用いた検証では、初期ツールがゼロの状態から開始しても既存の商用システムを上回る性能を達成し、獲得したツールが異なる領域でも有効に機能することや、進化の度合いを数値化する独自の収束指標の有効性が確認されました。
現代のAIエージェントシステムは、大規模言語モデル(LLM)の発展により目覚ましい進歩を遂げていますが、依然として「オープンエンド(終わりなき)」な環境への適応という大きな課題を抱えています。現実世界のタスクは常に変化し続けており、事前に定義された静的なツールセットやオフラインでの学習だけでは、刻々と変わる要求や未知の実行境界に対応することが困難です。特に、商用で提供されているクローズドソースのシステムは、その内部構造や使用されているツールが不透明なブラックボックスとなっており、科学的な検証や再現が難しいという障壁があります。一方で、既存のオープンソースの代替案は、手動で作成された静的なヒューリスティクスに依存していることが多く、商用システムの堅牢性には及ばないのが現状です。 また、多くの自己進化型システムは、明示的な報酬信号や外部からの監督がある環境、あるいは特定の狭いドメインに限定された範囲でしか機能しません。しかし、実際の運用環境では、正解ラベル(Ground Truth)が存在しないことが多く、ユーザーからのフィードバックも稀少です。…
本論文では、外部の監督信号に頼らず、タスクとの連続的な相互作用を経験のストリームとして捉え、実行フィードバックを長期的に再利用可能な能力へと昇華させる「現場自己進化(In-Situ Self-Evolving)」パラダイムを提案しています。この枠組みの中で、著者らは「ツールの進化」を能力拡張のための最も重要な経路として特定しました。ツール実行の成否は、コードが正常に動作するか例外を投げるかという客観的かつバイナリな信号として得られるため、人間による介入がなくても自律的な最適化が可能になるからです。 この思想を具現化したのが「Yunjue Agent」です。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related