AIエージェントが失敗したとき、「どの一手が致命傷だったのか?」を言い当てられますか? 意外に難しいのは、失敗が“最後の出力”ではなく、長い実行の途中で静かに始まっているからです。 この記事では、失敗の原因を実行軌跡から切り分ける「AgentRx / AGENTRX」が何を狙い、どう動き、何を確かめたのかを読み物として整理します。
AIエージェントの失敗は、「失敗した」という事実だけなら分かります。厄介なのは、どこで失敗が決定的になったかを局所化しにくいことです。論文はその理由として、実行が確率的で、長い手順をまたぎ、複数エージェントが絡み、さらにツール出力がノイズを含む点を挙げています。ここが重なると、同じタスクでも失敗の現れ方が揺れ、原因が“その場の一回限りの偶然”に見えてしまうのがややこしいところです。
提案は大きく2つです。 1つ目は、失敗した実行軌跡に手作業で注釈を付けたベンチマークです。115本の失敗軌跡を集め、各軌跡に「致命的な失敗ステップ」と、 grounded-theory に基づくクロスドメインの失敗分類(failure taxonomy)を付与した、とされています。ここで重要なのは、失敗を“まとめて一件”として扱わず、軌跡の中の一点(ステップ)に着地させる設計が、ベンチマークの段階から組み込まれていることです。
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related