継続更新

Yunque DeepResearch テクニカルレポート

従来の自律型エージェントは、長期間のタスクにおいて文脈のノイズが増大し、些細なエラーが連鎖してシステム全体が停止する脆弱性や、機能拡張の難しさという課題を抱えていた。本報告で提案するYunque DeepResearchは、中央集権的なオーケストレーション、動的な文脈管理、能動的な監視モジュールを組み合わせた階層的かつモジュール化された堅牢なフレームワークである。 このシステムは、メインエージェントがタスクを分解して専門的なサブエージェントやツール群に割り当てる仕組みを持ち、完了した中間目標を意味的な要約に圧縮することで情報の過負荷を防ぎつつ、異常検知による自己修正を実現している。ブラウザ操作やデータ分析に特化したサブエージェントを統合することで、複雑で自由度の高いリサーチタスクにおいて高い適応能力を発揮する。 検証ではGAIAやHumanity’s Last Examなどの複数のベンチマークにおいて世界最高水準の性能を達成しており、再現可能な実装コードや応用事例を含めてオープンソースとして公開されることで、コミュニティ全体の研究開発を促進することを目指している。

Yunque DeepResearch テクニカルレポート の図解
論文図解

TL;DR(結論)

従来の自律型エージェントは、長期間のタスクにおいて文脈のノイズが増大し、些細なエラーが連鎖してシステム全体が停止する脆弱性や、機能拡張の難しさという課題を抱えていた。本報告で提案するYunque DeepResearchは、中央集権的なオーケストレーション、動的な文脈管理、能動的な監視モジュールを組み合わせた階層的かつモジュール化された堅牢なフレームワークである。 このシステムは、メインエージェントがタスクを分解して専門的なサブエージェントやツール群に割り当てる仕組みを持ち、完了した中間目標を意味的な要約に圧縮することで情報の過負荷を防ぎつつ、異常検知による自己修正を実現している。ブラウザ操作やデータ分析に特化したサブエージェントを統合することで、複雑で自由度の高いリサーチタスクにおいて高い適応能力を発揮する。 検証ではGAIAやHumanity’s Last Examなどの複数のベンチマークにおいて世界最高水準の性能を達成しており、再現可能な実装コードや応用事例を含めてオープンソースとして公開されることで、コミュニティ全体の研究開発を促進することを目指している。

なぜこの問題か

人工汎用知能(AGI)の追求において、大規模言語モデルをスケールアップさせることで膨大な受動的知識を内部化する手法が取られてきたが、現実世界の動的な環境から自ら情報を発見し、検証し、統合する能動的な能力が不足しているという根本的な限界が存在する。この制約を克服するために、静的な対話モデルから、自律的に問題を解決するエージェントシステムへのパラダイムシフトが必要とされている。その中核となるのが「ディープリサーチ」であり、これはエージェントが多段階の推論を構築し、ウェブブラウザなどの外部ツールを活用して、自由度の高い情報空間を自律的に探索する能力を指す。 しかし、既存のモノリシックなエージェント構成では、ディープリサーチの可能性を十分に引き出すことが困難であり、主に三つの深刻な課題に直面している。第一に、長期的なタスクにおける認知的な過負荷である。数百ステップに及ぶ対話が必要な場合、実行ログが蓄積されることで本来のユーザーの意図が希釈され、推論の精度が著しく低下する。第二に、システム的な脆弱性とエラーの連鎖である。…

核心:何を提案したのか

本報告では、ディープリサーチの複雑さを管理するために設計された階層的なエージェントフレームワークであるYunque DeepResearchを提案する。このフレームワークの最大の特徴は、戦略的な推論プロセスと具体的なアクションの実行を明確に分離したデカップリング設計にあり、これにより高いモジュール性と拡張性を実現している。システムは主に四つの協調的なモジュールで構成されている。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む