AI研究 2026-01-29 タグ: cs.AI

深層リサーチャー：省察と進化

Deep Researcher Reflect Evolveは、従来の並列処理による情報の断片化を解決するため、逐次的な研究計画の洗練と「候補の交差」アルゴリズムを導入した新しいAIアーキテクチャである。

論文図解

TL;DR（結論）

Deep Researcher Reflect Evolveは、従来の並列処理による情報の断片化を解決するため、逐次的な研究計画の洗練と「候補の交差」アルゴリズムを導入した新しいAIアーキテクチャである。グローバルな研究コンテキストを維持し、実行時に計画を動的に修正する「振り返り」機能と、異なるパラメータを持つ複数のLLM候補を統合する仕組みにより、情報の網羅性と事実密度を大幅に向上させている。博士レベルの課題を用いたベンチマーク評価において46.21のスコアを記録し、ClaudeやPerplexityなどの既存エージェントを上回る性能を示したことで、逐次的なアプローチの優位性が実証された。

なぜこの問題か

深層リサーチエージェント（DRA）の開発において、これまで主流だったのは「並列スケーリング」というパラダイムであった。この手法は、研究トピックを複数の独立したサブトピックに分解し、それぞれを並列に調査することで処理時間を短縮し、安定したパフォーマンスを得ることを目的としている。しかし、このアプローチには「知識のサイロ化」という重大な欠陥が存在する。各エージェントが自身の担当する特定のサブタスクという真空状態で動作するため、システム全体を俯瞰する「グローバルな文脈」が欠如してしまうのである。この孤立状態により、モデルは異なる枝葉で発見された情報の重複を認識できず、冗長な検索クエリを繰り返したり、調査の過程で得られた新しい知見に基づいてリアルタイムに計画を修正したりすることが困難になる。また、並列的な手法では、ある領域での発見が他の領域の調査方針に影響を与えるといった、人間が行うような有機的な研究プロセスを再現できない。先行研究である「The Sequential Edge (Chopra 2025)」によれば、逐次的なスケーリングは、95.6%の構成において並列的な自己整合性パラダイムを一貫して上回り、最大で46.…

核心：何を提案したのか

本論文は、複雑なトピックに対して詳細な研究レポートを生成するために設計された「Deep Researcher Reflect Evolve」アーキテクチャを提案している。このシステムの核心は、2つの主要な革新にある。第一に、「振り返り（Reflection）による逐次的な研究計画の洗練」である。これは、中央集権的な「グローバル・リサーチ・コンテキスト」を維持することで、エージェントが過去のすべての探索軌跡や収集されたデータ、事実、数値を記憶し、それに基づいて現在の進捗を評価する仕組みである。これにより、エージェントは実行時に研究計画を動的に変更し、未探索の領域を特定したり、冗長な経路を遮断したりすることが可能になる。第二の革新は、「候補の交差（Candidates Crossover）」アルゴリズムである。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。