AI研究 | Cog AI Archive

AI研究 2026-02-04

生成デコンプレッション：分布の不一致に対する最適な非可逆復号化

本論文は、圧縮機の設計時に想定したデータ分布と実際のソース分布が異なる「分布の不一致」が発生する状況において、送信側のエンコーダを一切変更することなく、受信機側のみの調整で歪みを最小化する「生成デコンプレッション」を提案している。

6708 字

読む →

AI研究 2026-02-04

ステップ単位の忠実度最大化による誠実な推論の学習

大規模言語モデルの多段階推論において、従来の最終回答のみを評価する強化学習は、論理を無視して正解を推測する過度な自信やハルシネーションを助長する課題がありましたが、本研究は推論の各ステップが証拠に基づいているかを直接評価する新しい強化学習フレームワーク「FaithRL」を提案しました。

6673 字

読む →

AI研究 2026-02-04

すべての負例が等しいわけではない：LLMはもっともらしい推論からより良く学習する

大規模言語モデル（LLM）の推論能力を向上させるためには、単なる誤答ではなく、論理構成は一貫しているが結論だけが誤っている「もっともらしい負例（PNS）」が極めて重要な学習信号になることを解明した。

6180 字

読む →

AI研究 2026-02-04

Morphe: ビジョン基盤モデルを用いた高忠実度な生成的ビデオストリーミング

現在のインターネットトラフィックの65%以上を占めるビデオストリーミングは、高速鉄道や遠隔地などの不安定なネットワーク環境において、従来のH.264やH.265といったピクセルベースのコーデックでは帯域不足による品質劣化や再生の中断を避けられないという深刻な課題に直面しています。

6135 字

読む →

AI研究 2026-02-04

ペルソナ・ジェネレーター：多様な合成ペルソナの大規模な生成

AIシステムの安全性や信頼性を評価するためには多様なユーザー行動の再現が不可欠だが、従来の生成手法は平均的な分布の再現に偏り、稀な特性を持つ「ロングテール」の挙動を見落とす課題があった。本研究はAlphaEvolveを用いたコード最適化により、任意の文脈で多様な合成ペルソナをオンデマンド生成する「ペルソナ・ジェネレーター」を開発し、可能性の全範囲を網羅する「カバレッジ」の最大化を実現した。検証の結果、進化したジェネレーターは未知のテストセットで80%以上のカバレッジを達成し、標準的な言語モデルの出力では困難だった極端な意見や複雑な性格の組み合わせを効率的に生成することに成功した。

5655 字

読む →

AI研究 2026-02-04

ELIQ：進化するAI生成画像のためのラベルフリーな品質評価フレームワーク

画像生成AIの急速な進化は、従来の人間による評価スコア（MOS）を「知覚的ドリフト」によって急速に陳腐化させ、再評価に膨大なコストを強いるという課題を生んでいる。本研究が提案するELIQは、人間の注釈を一切介さず、最新の生成モデルを用いた高品質な正例と、意図的に劣化させた負例のペアを自動構築することで、視覚的品質とプロンプト整合性の両面からAI生成画像を評価する革新的なラベルフリー・フレームワークである。命令チューニングを施したマルチモーダル言語モデル（MLLM）を「品質に敏感な批評家」として適応させ、さらに軽量なQuality Query Transformer（QQT）とゲート付き融合メカニズムを組み合わせることで、単一画像からの高精度な品質予測を実現している。複数のベンチマークにおける検証の結果、ELIQは既存のラベルフリー手法を大幅に凌駕し、教師あり学習モデルに迫る性能を示した。さらに、AI生成画像（AIGC）だけでなくユーザー生成コンテンツ（UGC）にもそのまま適用可能な高い汎用性を持ち、生成モデルの進化に合わせて評価基準を動的に更新できるスケーラブルな評価基盤としての有効性が証明されている。

5957 字

読む →

AI研究 2026-02-04

EVE: 近似アンラーニングにおけるカスタマイズされた摂動を用いたデータ消去の効率的な検証

1. 機械学習モデルから特定のデータを削除する「アンラーニング」が正しく実行されたかを検証するため、モデルの初期学習フェーズへの関与を一切必要とせず、アンラーニングの実行段階のみで効率的に動作する新しい検証手法「EVE」を提案する。 2.

5645 字

読む →

AI研究 2026-02-04

音響・視覚共同表現のための非対称な階層的アンカリング：堅牢なクロスモーダル汎化に向けた情報割り当ての曖昧さの解消

従来の音声と視覚の共同表現学習におけるクロスモーダル汎化では、対称的な構造が情報の割り当てに曖昧さを生じさせ、意味情報が特定のモダリティ固有のブランチに漏洩することで、ラベルのないターゲットモダリティへの知識転送が阻害されるという深刻な課題がありました。

5948 字

読む →

AI研究 2026-02-04 長文

必要な時にグラフを使用する：検索拡張生成とグラフの効率的かつ適応的な統合

大規模言語モデルのハルシネーションや知識の風化を防ぐため、クエリの構文的な複雑さを解析して、従来のRAG（検索拡張生成）と構造的な知識グラフを用いるGraphRAGを動的に切り替える新フレームワーク「EA-GraphRAG」が提案されました。

7411 字

読む →

AI研究 2026-02-04

読んだことすべてを信じてはいけない：誤解を招くツール説明下におけるMCPの挙動の理解と測定

Model Context Protocol（MCP）は、大規模言語モデル（LLM）が自然言語の説明を通じて外部ツールを呼び出すための標準規格ですが、ツールの説明文と実際の実行コードの整合性を強制する仕組みが欠如しています。

5875 字

読む →

生成AI研究を、要点から追う。

最新の記事

生成デコンプレッション：分布の不一致に対する最適な非可逆復号化

ステップ単位の忠実度最大化による誠実な推論の学習

すべての負例が等しいわけではない：LLMはもっともらしい推論からより良く学習する

Morphe: ビジョン基盤モデルを用いた高忠実度な生成的ビデオストリーミング

ペルソナ・ジェネレーター：多様な合成ペルソナの大規模な生成

ELIQ：進化するAI生成画像のためのラベルフリーな品質評価フレームワーク

EVE: 近似アンラーニングにおけるカスタマイズされた摂動を用いたデータ消去の効率的な検証

音響・視覚共同表現のための非対称な階層的アンカリング：堅牢なクロスモーダル汎化に向けた情報割り当ての曖昧さの解消

必要な時にグラフを使用する：検索拡張生成とグラフの効率的かつ適応的な統合

読んだことすべてを信じてはいけない：誤解を招くツール説明下におけるMCPの挙動の理解と測定