オープンな重みを持つコーディングエージェントにおいて、プライベートなコードベースに低コストで特化できる手法「SERA」が提案されました。教師あり微調整のみを用いながら、既存の強化学習手法の26倍、合成データ手法の57倍という低コストで最先端の性能を達成しました。単一のリポジトリから数千の学習軌跡を生成可能です。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related