タグ: cs.SE | Cog AI Archive

Cog AI Archive

最新の記事

公開記事: 41件タグ: cs.SE

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

AI研究 2026-01-29 閲覧 36 クリック 16

最新人気保存済み長文のみ

AI研究 2026-01-28

HE-SNR：エントロピーで潜在的な論理を解明し、SWE-benchでの中間学習（Mid-Training）を導く

TL;DRSWE-benchなどの複雑なソフトウェア工学タスク向けLLMの中間学習において、従来のPerplexity（PPL）に代わる新指標「HE-SNR」を提案した研究です。単なる正解予測ではなく「合理的な迷い」をエントロピー圧縮状態として捉える仮説に基づき設計され、産業規模のMoEモデルで高い予測性能と堅牢性が実証されました。

読了 0 分 1370 字

読む →

AI研究 2026-01-28

LogSieve：LLMによるCIログ分析をサステナブルにするタスク認識型ログ削減手法

TL;DRLogSieveは、CIログの冗長性を解消し、LLMによる分析を効率化する軽量なログ削減手法である。情報量の少ない行をフィルタリングしつつ、根本原因分析に必要な文脈を保持する。GitHub Actionsのログを用いた評価では、意味の損失を最小限に抑えつつ平均40%以上のトークン削減を達成し、コストと環境負荷の低減に貢献する。

読了 0 分 1500 字

読む →

AI研究 2026-01-27

検索システムフレームワークの分類学：その落とし穴とパラダイム

TL;DR埋め込み検索システムの設計における複雑なトレードオフを整理した研究です。表現、粒度、オーケストレーション、堅牢性の4つの層に分け、Bi-encoder等のモデル選択からチャンク分割、再ランク付けパイプライン、ドメイン適応までを体系化し、現代のニューラル検索システム最適化のための包括的な枠組みを提案しています。

読了 0 分 1265 字

読む →

AI研究 2026-01-27

マルチエージェントメカニズム設計による査読プロセスの再構築

TL;DRソフトウェア工学研究における査読システムの崩壊危機に対し、計算論的解決策を提唱するポジションペーパー。研究コミュニティを確率的マルチエージェントシステムとしてモデル化し、マルチエージェント強化学習（MARL）を用いて、投稿クレジット経済や最適化された査読者割り当て等のインセンティブ適合プロトコルを設計する新たな研究課題を提示する。

読了 0 分 1298 字

読む →

AI研究 2026-01-27

Veri-Sure：正しいRTLコード生成のための時間的追跡と形式検証を備えた契約認識型マルチエージェントフレームワーク

TL;DR大規模言語モデル（LLM）によるRTL設計における機能的な正確性の課題に対し、Veri-Sureというマルチエージェントフレームワークを提案。設計契約による意図の整合や静的依存スライスに基づく修正、形式検証を組み合わせることで、シミュレーションだけでは困難なシリコングレードの正確性を実現し、既存手法を凌駕する性能を示した。

読了 0 分 1567 字

読む →

AI研究 2026-01-27

AlignCoder：リポジトリレベルのコード補完に向けた検索とターゲット意図のアライメント

TL;DRリポジトリレベルのコード補完において、従来の検索拡張生成（RAG）手法が抱える「クエリとターゲットコードの不整合」および「推論情報の活用不足」という課題を解決するフレームワーク「AlignCoder」を提案。強化学習を用いた検索器の訓練とクエリ拡張により、ベンチマークで18.1%の精度向上を達成した。

読了 0 分 1337 字

読む →

AI研究 2026-01-27

効率的なコード位置特定のための適応型並列実行の学習

TL;DR自動ソフトウェア開発においてボトルネックとなるコード特定（Code Localization）の効率化手法「FuseSearch」を提案。並列実行時の冗長な呼び出しを削減するため、独自の品質・効率最適化タスクとして再定義し、SFTと強化学習で訓練。

読了 0 分 1435 字

読む →

AI研究 2026-01-27

AACR-Bench: 包括的なリポジトリレベルのコンテキストを用いた自動コードレビューの評価

TL;DR大規模言語モデル（LLM）を用いた自動コードレビューの評価に向け、既存の問題を解決する「AACR-Bench」が登場した。複数言語対応とリポジトリ全体のコンテキスト提供に加え、AIと専門家による検証で欠陥検出率を285%向上させた。実験ではコンテキスト粒度や検索手法の影響が明らかになり、評価基準の厳格化に成功した。

読了 0 分 1482 字

読む →

AI研究 2026-01-27

SETA：複合AIシステムのための統計的障害要因特定

TL;DR複数のニューラルネットワークで構成される複合AIシステムの耐性テストにおける課題を解決するフレームワーク「SETA」が提案されました。テストデータへの摂動適用を通じて、各コンポーネントのエラーを分離し、モジュール間のエラー伝播を推論します。実世界の鉄道検査システムへの適用で、エンドツーエンド指標を超えた詳細な分析が可能。

読了 0 分 1439 字

読む →

AI研究 2026-01-27

AgenticSCR：未成熟な脆弱性検出のための自律的エージェント型セキュアコードレビュー

TL;DRAgenticSCRは、コミット前段階のコードレビューにおいて、未成熟な脆弱性を検出するための自律型AIエージェントです。LLMに自律的な意思決定やツール使用能力を統合し、セキュリティに焦点を当てた意味的記憶で強化されています。

読了 0 分 1498 字

読む →

保存済みの記事がまだありません。

読み込み中…

前へ次へ

生成AIの最新動向を、読みやすいアーカイブで。

RedSage: サイバーセキュリティに特化した汎用LLM

最新の記事

RedSage: サイバーセキュリティに特化した汎用LLM

HE-SNR：エントロピーで潜在的な論理を解明し、SWE-benchでの中間学習（Mid-Training）を導く

LogSieve：LLMによるCIログ分析をサステナブルにするタスク認識型ログ削減手法

検索システムフレームワークの分類学：その落とし穴とパラダイム

マルチエージェントメカニズム設計による査読プロセスの再構築

Veri-Sure：正しいRTLコード生成のための時間的追跡と形式検証を備えた契約認識型マルチエージェントフレームワーク

AlignCoder：リポジトリレベルのコード補完に向けた検索とターゲット意図のアライメント

効率的なコード位置特定のための適応型並列実行の学習

AACR-Bench: 包括的なリポジトリレベルのコンテキストを用いた自動コードレビューの評価

SETA：複合AIシステムのための統計的障害要因特定

AgenticSCR：未成熟な脆弱性検出のための自律的エージェント型セキュアコードレビュー

論文×チャット×知識DBを続けるなら

Free

Plus

Pro