本研究は、小規模言語モデル(SLM)の推論能力を向上させるマルチエージェント枠組み「DebateCoder」を提案しています。3つの役割を持つエージェントと95%の閾値を持つ適応型信頼ゲートを導入し、生成前後の議論と修正プロセスを構築しました。HumanEvalで70.12%のPass@1を達成し、コストを約35%削減することに成功しています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related