継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

QUARK: クエリをアンカーとした集約による、非忠実なクエリ下でのロバストな検索

現実の検索では、ユーザーのクエリが記憶違いや情報の欠落により本来の意図を正確に反映しない「非忠実」な状態が多々ありますが、本研究は複数の回復仮説を生成して不確実性をモデル化し、元のクエリをセマンティックなアンカーとして保持しながら検索結果を統合する学習不要のフレームワーク「QUARK」を提案しました。

6569 字
読む →

SMKC:可変カーディナリティ時系列異常検知のためのスケッチに基づくカーネル相関画像

従来の多変量時系列異常検知は変数の数が不変であることを前提としていたが、実際の運用環境ではセンサーの追加・削除・名称変更といった「センサーの入れ替わり」が頻繁に発生し、入力の次元数が変動するという課題がある。

5681 字
読む →

Llama-3.1-FoundationAI-SecurityLLM-Reasoning-8B 技術報告書

Foundation-Sec-8B-Reasoningは、Llama-3.1-8Bを基盤として開発された、サイバーセキュリティ分野で初となるオープンソースのネイティブ推論モデルであり、複雑なセキュリティ分析において「思考」プロセスを明示する能力を備えている。

5842 字
読む →

深層複合AIシステムのためのテキスト平衡伝搬

大規模言語モデル(LLM)やツールを組み合わせた複合AIシステムが深層化するにつれ、従来のグローバルなテキストフィードバック手法では、情報の爆発によるコンテキスト超過や、情報の消失による具体性の欠如という深刻な課題に直面しています。

5877 字
読む →

ソフトウェア工学におけるLLMの包括的なベンチマーク基盤の構築に向けて

現在のコード用大規模言語モデルの評価は、特定のタスクや単純な正解率指標に偏っており、実世界のソフトウェア開発で不可欠な堅牢性、解釈可能性、公平性、効率性といった多角的な側面を十分に評価できていないという課題があります。

6430 字
読む →

LOCUS:効率的なモデル探索、比較、および選択のための低次元モデル埋め込み

LOCUSは、大規模言語モデル(LLM)の多様な能力をアテンション機構によって低次元のベクトル(モデル埋め込み)として表現する新しい手法であり、モデルの比較や選択、クエリルーティングを大幅に効率化する。

5980 字
読む →

OpenSec:敵対的証拠下におけるインシデント対応エージェントのキャリブレーションの測定

OpenSecは、インシデント対応(IR)エージェントが敵対的な証拠やプロンプトインジェクションに直面した際の判断の正確性(キャリブレーション)を評価するための、二重制御(dual-control)強化学習環境である。

7155 字
読む →

Eisenstein-Jacobi相互接続トポロジにおける故障適応型ルーティングのための深層強化学習

現代のメニーコアシステムで期待されるEisenstein-Jacobi(EJ)ネットワークにおいて、従来のGreedy手法は故障発生時に到達率が10%まで低下し、最適解であるDijkstra法は計算負荷が過大になるという課題がある。

5723 字
読む →

責任あるAI:善、悪、そしてAI

AI導入による戦略的利益と倫理的・運用的リスクの対立を、単なる二者択一のトレードオフではなく、永続的に共存し相互に依存する「パラドックス」として再定義し、その緊張を動的に管理するための理論的枠組みであるPRAIGを提案している。

5751 字
読む →

Magellan:AlphaEvolveを用いた新規コンパイラ最適化ヒューリスティクスの自律的発見

Magellanは、大規模言語モデル(LLM)と進化的探索、自動チューニングを組み合わせることで、コンパイラの最適化パスを制御するC++の意思決定ロジックを自律的に生成するエージェント型フレームワークである。 LLVMの関数インライニングにおいて、数十年にわたる手動エンジニアリングを凌駕する5.

5720 字
読む →