プログラム検証におけるボトルネックである「検証条件(VC)」の自動証明に特化した、初の実世界・多言語ベンチマーク「NTP4VC」が提案されました。Linux等の実プロジェクトから生成されたデータを用い、Isabelle、Lean、Rocqに対応。LLMの可能性と現状の課題を浮き彫りにしています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related