継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

ノイズの幾何学:なぜ拡散モデルはノイズ条件付けを必要としないのか

ノイズレベルを入力しない自律(ノイズ非依存)生成モデルでも、学習された単一の時間不変ベクトル場は「闇雲なデノイズ」ではなく、未知ノイズを周辺化した周辺密度 \(p(\mathbf{u})=\int p(\mathbf{u}\mid t)p(t)\,dt\) に対応する周辺エネルギー \(E_{\text{marg}}(\mathbf{u})=-\log p(\mathbf{u})\) の幾何と結び付いています。 / ただし周辺エネルギーの生の勾配はデータ多様体の法線方向に \(1/t^p\) 型の特異性を持ち、通常の勾配降下では不安定になり得ますが、論文は相対エネルギー分解により、学習場が局所的な共形計量(実効ゲイン)を暗黙に含むリーマン勾配流として振る舞い、特異性を前処理して打ち消す構図を示します。 / さらに自律サンプリングの構造安定性条件を与え、ノイズ予測パラメータ化には推定誤差を増幅し得る「Jensen Gap」がある一方、速度ベースのパラメータ化は有界ゲイン条件により後部分布の不確実性を滑らかな幾何学的ドリフトへ吸収できる、という含意を導きます。

7236 字
読む →

AutoNumerics:自然言語から古典的な数値PDEソルバーを自律生成するマルチエージェント枠組み

AutoNumericsは、自然言語で書かれた偏微分方程式(PDE)の問題記述を受け取り、古典的な数値解析に基づく解釈可能なソルバーを、設計から実装・デバッグ・検証まで自律的に作る枠組みです。 / 複数のLLMエージェントが、問題の構造化、複数スキーム案の立案と不適切案の除外、粗い格子での論理バグ修正と高解像度での安定性確認、解析解がない場合の残差に基づく自己検証までを段階的に連携します。 / 24個の代表的なPDE問題で、既存のニューラル系やLLM系の手法と比べて同等以上の精度を示したと報告されており、PDEの構造に応じたスキーム選択も行えることから、PDE自動解法を使いやすくする実装指向の道筋を示しています。

5625 字
読む →

いつでも有効な統計的ウォーターマーキングに向けて

本論文は、統計的ウォーターマーキング検出を逐次(ストリーミング)で監視しながら、止めるタイミングをデータに応じて選んでも偽陽性(Type I error)の上限が崩れない枠組みを示しています。 / 生成側と検出側が共有するアンカー分布p0を導入し、ターゲット分布qがp0の近傍にあるという前提のもとで、トークンと疑似乱数シードの依存を埋め込みつつ、検出をe-value(非負のスーパー・マルチンゲール)として設計します。 / 理論として最悪ケースの対数成長率と期待停止時間の関係を与え、シミュレーションと既存ベンチマーク評価により、平均の検出トークン予算を最先端ベースラインより13〜15%削減できたと報告しています。

5663 字
読む →

連合U字型スプリット学習の中間表現を守るKD-UFSL:マイクロアグリゲーションと差分プライバシーの併用

UFSLはデータとラベルをクライアントに残しつつ計算の一部をサーバへオフロードできますが、クライアントが送る中間表現(smashed data)から生データが再構成され得るため、サーバが「正直だが好奇心旺盛」な場合でも漏えい経路になり得ます。

6592 字
読む →

安いチェックをいつ信じるか:推論における弱い検証と強い検証

推論を含む大規模言語モデルの運用では、速くて安いが不完全な弱い検証と、信頼を確立しやすい一方で資源を要する強い検証の使い分けがボトルネックになりやすく、本論文はその緊張関係を「いつ強い検証に委ねるか」という意思決定として整理しています。

7018 字
読む →

FAMOSE:ReActにもとづく自動特徴量発見フレームワークの提案

表形式データでは、モデルが比較的単純でも性能を詰めにくく、その主因になりがちな特徴量設計を、人手の直感や領域知識に頼らず進める仕組みが求められています。 / ReActの枠組みを用いたエージェントが、データを観察しながら特徴量を提案し、コード実行で妥当性を確認し、検証用データでの指標変化を見て失敗を修正し、良かった特徴量だけを段階的に蓄積していきます。 / 多数の公開データセットでの実験では、分類で最先端水準に近い性能、回帰で最先端水準の性能が報告されており、反復の履歴を文脈に残すことが創造的な特徴量の発見に効いている可能性が示されています。

6001 字
読む →

A.R.I.S.:深層学習で破砕電子廃棄物をリアルタイム分類する自動選別システム

破砕後の電子廃棄物は金属・プラスチック・基板などが混ざり、既存の分離法だけでは細かな見分けが難しいため、回収できる資源が取りこぼされやすい状況があります。 / A.R.I.S.は、RGBカメラで搬送中の破砕片を撮影してYOLOxで3分類し、その推論結果をPLCに渡して空圧パドルを所定タイミングで動かし、実際のライン上で弾き分けまで行う統合システムです。 / 実験評価では全体の適合率90%、平均適合率82.2%、選別純度84%が示され、深層学習を既存の選別の考え方と接続することで高度なリサイクル導入の障壁を下げ得ることが示唆されています。

5908 字
読む →

細粒度の詳細ターゲティングでブラックボックスLVLM攻撃の到達点を押し広げる:M-Attack-V2

転送型ブラックボックス攻撃で強力だったM-Attackは、局所クロップ同士の一致という設計の裏側で、反復ごとに勾配が高分散になりほぼ直交して最適化が不安定になる問題があり、M-Attack-V2はこの不安定さを「勾配のデノイジング」として正面から抑える改良です。

5900 字
読む →

「Mine and Refine」:段階的関連度を前提にしたEC検索リトリーバ学習を整理します

EC検索の候補生成では、完全一致だけでなく代替品や補完品も許容されるため、関連度を段階で扱い、段階ごとに類似度スコアの境界が分かれるように学習しておくと、ハイブリッド混合やしきい値設定が安定しやすくなります。

6511 字
読む →

MARS:マージンを考慮した自己洗練による報酬モデリング――曖昧さ(低マージン)へ学習を寄せる適応的データ拡張

人手の選好データに強く依存する報酬モデリングでは、どの比較が「判断しにくいか」を無視して一様に増やしても、モデルの弱点に学習が届かない可能性があるため、推定が難しい領域を狙って鍛える発想が重要です。

4780 字
読む →