ASTRAは、ツール利用エージェントを訓練するための完全自動化されたエンドツーエンドのフレームワークです。ツール呼び出しグラフに基づく多様な軌跡の合成と、検証可能な実行環境の自動生成を組み合わせることで、教師あり学習と強化学習を統合しました。複数のベンチマークで、クローズドモデルに匹敵する最高水準の性能を達成しています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related