継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

深層複合AIシステムのためのテキスト平衡伝搬

大規模言語モデル(LLM)やツールを組み合わせた複合AIシステムが深層化するにつれ、従来のグローバルなテキストフィードバック手法では、情報の爆発によるコンテキスト超過や、情報の消失による具体性の欠如という深刻な課題に直面しています。

5877 字
読む →

グラフ基盤モデルにおける分布外汎化

グラフ基盤モデル(GFM)は、多様なグラフデータから汎用的な表現を学習し、未知のデータ分布(分布外、OOD)に対しても高い適応力を発揮することを目指す新しいパラダイムであり、本論文はその最新動向を「分布外汎化」の観点から整理した初の包括的サーベイである。

6334 字
読む →

ソフトウェア工学におけるLLMの包括的なベンチマーク基盤の構築に向けて

現在のコード用大規模言語モデルの評価は、特定のタスクや単純な正解率指標に偏っており、実世界のソフトウェア開発で不可欠な堅牢性、解釈可能性、公平性、効率性といった多角的な側面を十分に評価できていないという課題があります。

6430 字
読む →

LOCUS:効率的なモデル探索、比較、および選択のための低次元モデル埋め込み

LOCUSは、大規模言語モデル(LLM)の多様な能力をアテンション機構によって低次元のベクトル(モデル埋め込み)として表現する新しい手法であり、モデルの比較や選択、クエリルーティングを大幅に効率化する。

5980 字
読む →

OpenSec:敵対的証拠下におけるインシデント対応エージェントのキャリブレーションの測定

OpenSecは、インシデント対応(IR)エージェントが敵対的な証拠やプロンプトインジェクションに直面した際の判断の正確性(キャリブレーション)を評価するための、二重制御(dual-control)強化学習環境である。

7155 字
読む →

Eisenstein-Jacobi相互接続トポロジにおける故障適応型ルーティングのための深層強化学習

現代のメニーコアシステムで期待されるEisenstein-Jacobi(EJ)ネットワークにおいて、従来のGreedy手法は故障発生時に到達率が10%まで低下し、最適解であるDijkstra法は計算負荷が過大になるという課題がある。

5723 字
読む →

MapPFN: コンテキスト内での因果的摂動マップの学習

MapPFNは、未知の生物学的コンテキストにおける遺伝子摂動の影響を予測するために、インコンテキスト学習を活用する新しい事前データ適合ネットワーク(PFN)です。このモデルは、勾配ベースの最適化を必要とせず、少数の実験結果をコンテキストとして取り込むことで、新しい介入後の細胞状態の分布を即座に推論する能力を持っています。 合成データのみを用いた事前学習を行っているにもかかわらず、実世界の単一細胞データにおいて差分的発現遺伝子を特定する性能は、実際のデータで学習された既存のモデルに匹敵する水準に達しています。これにより、高コストな実験を削減し、創薬ターゲットの発見を加速させる仮想細胞モデルとしての活用が期待されます。 マルチモーダル拡散トランスフォーマー(MMDiT)アーキテクチャを採用し、細胞をトークンとして扱うことで、事前分布と介入後の分布の間の複雑な写像を学習することに成功しています。特に、複数の介入結果を条件として与えることで予測精度が向上し、従来のモデルが抱えていた、新しい環境への適応能力の欠如という課題を克服しています。

5707 字
読む →

責任あるAI:善、悪、そしてAI

AI導入による戦略的利益と倫理的・運用的リスクの対立を、単なる二者択一のトレードオフではなく、永続的に共存し相互に依存する「パラドックス」として再定義し、その緊張を動的に管理するための理論的枠組みであるPRAIGを提案している。

5751 字
読む →

Magellan:AlphaEvolveを用いた新規コンパイラ最適化ヒューリスティクスの自律的発見

Magellanは、大規模言語モデル(LLM)と進化的探索、自動チューニングを組み合わせることで、コンパイラの最適化パスを制御するC++の意思決定ロジックを自律的に生成するエージェント型フレームワークである。 LLVMの関数インライニングにおいて、数十年にわたる手動エンジニアリングを凌駕する5.

5720 字
読む →

Magellan:AlphaEvolveを用いた新規コンパイラ最適化ヒューリスティクスの自律的発見

現代のコンパイラが依存する手動設計のヒューリスティクスは、複雑なソフトウェアや多様なハードウェアへの適応が困難で保守負担も大きいという課題がありますが、本研究ではLLMと進化探索、自動チューニングを組み合わせたエージェント型フレームワーク「Magellan」を提案し、実行可能なC++の決定ロジックを直接合成することでこの問題を解決します。 LLVMの関数インライニングにおいて、Magellanは数十年にわたる専門家の手動設計を上回る新しいヒューリスティクスを合成し、バイナリサイズの削減率で5.23%の向上を達成したほか、生成されたコードは手動実装の約15分の1という極めて簡潔な記述でありながら、既存のコンパイラに直接統合して運用できる高い実用性を備えていることが確認されました。 この手法はレジスタ割り当てやXLAなどの異なる最適化タスクやコンパイラ基盤にも適用可能であり、特定のベンチマークへの過学習を避けつつ、時間の経過や異なるアプリケーション領域に対しても高い汎用性を示すことが実証されており、ニューラルネットワークを直接コンパイラに組み込む手法に代わる、保守性と性能を両立した新しい自動設計の道を切り拓いています。

6353 字
読む →