AIコーディングエージェントはいかにコードを修正するか:GitHubプルリクエストの大規模研究
TL;DRAIコーディングエージェントによるプルリクエスト(PR)と人間によるPRの違いを大規模に調査した研究。24,014件のエージェントによるPRと5,081件の人間によるPRを比較した結果、コミット数に大きな違いが見られ、変更ファイル数や削除行数にも中程度な差異があった。PR記述と実際の変更内容の一致度は、AIエージェントの方がわずかに高かった。
AI研究の要点を整理。最新の論文記事をカテゴリやタグで探索できます。
運営: Cognitive Research Labs(CRL) / crl.co.jp
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
Cog AI Archive
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
TL;DRAIコーディングエージェントによるプルリクエスト(PR)と人間によるPRの違いを大規模に調査した研究。24,014件のエージェントによるPRと5,081件の人間によるPRを比較した結果、コミット数に大きな違いが見られ、変更ファイル数や削除行数にも中程度な差異があった。PR記述と実際の変更内容の一致度は、AIエージェントの方がわずかに高かった。
Pricing