継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

ProFlow: 近接流ガイダンスによるゼロショット物理整合サンプリング

ProFlowは、少数の観測データから偏微分方程式(PDE)を厳密に満たす物理場を推定するための、新しいゼロショット物理整合サンプリング手法である。既存の生成モデルが物理的制約をソフトなペナルティとしてしか扱えず、再学習なしでは厳密な整合性を維持できないという課題に対し、本手法は近接最適化と線形補間を組み合わせた二段階のガイダンス機構を導入している。ポアソン方程式やバーガース方程式を用いた検証により、従来の拡散モデルやフローベースの手法と比較して、物理的および観測的な整合性と統計的な正確性の両面で優れた性能を示すことが確認された。

6424 字
読む →

確率的リプシッツ最適化のための証明に基づく枝刈り

本研究は、評価にノイズが含まれるリプシッツ関数のブラックボックス最適化において、最適解が含まれる可能性のある領域を「アクティブセット」として明示的に管理し、非最適な領域を数学的根拠に基づいて切り捨てる新手法「Certificate-Guided Pruning(CGP)」を提案した。

6175 字
読む →

MALLOC: 大規模シーケンシャル推薦のためのメモリ効率を考慮した長文脈圧縮ベンチマーク

大規模シーケンシャル推薦システムにおいて、ユーザーの長い行動履歴を扱う際の計算コスト増大とメモリ消費の爆発という「メモリと遅延のジレンマ」を解決するため、メモリ効率を重視した包括的な圧縮技術の評価枠組みであるMALLOCを提案した。

6109 字
読む →

AIがスキル形成に与える影響

AIアシスタントを利用して新しいプログラミングライブラリの習得を試みたグループは、利用しなかったグループと比較して、事後の理解度テストのスコアが平均で17%(グレードポイントで2点分)低下し、概念理解やデバッグ能力が損なわれることが判明しました。

6342 字
読む →

Rectified Flowのサンプル複雑度は最適レートを達成:拡散モデルを超える効率性の理論的背景

本研究は、Rectified Flow(RF)がターゲット分布を学習する際に必要とするサンプル数(サンプル複雑度)において、情報理論的な下限値である $\tilde{O}(\epsilon^{-2})$ を達成することを理論的に証明しました。

5949 字
読む →

ブルームの分類学に基づくドメインガイドラインからの自動ベンチマーク生成

本研究は、専門家のガイドラインからブルームの分類学に基づいた評価問題を自動生成するフレームワーク「BLOOMQA」を開発し、既存の試験データに依存しない新しい評価手法を確立しました。教育、栄養学、介護の3つの実務ドメインにおいて、指針への違反を題材とした多肢選択式問題と対話データを合計約6万件生成し、大規模言語モデル(LLM)の推論能力を多角的な認知レベルで測定可能にしました。検証の結果、LLMは「分析」のような高次の推論で高い性能を示す一方で、「記憶」のような基礎的な項目で失敗するという、人間の学習プロセスとは異なる非直感的な挙動を示すことが明らかになりました。

7261 字
読む →

フィッシングURL検出のためのLeast-to-Most推論の抽出

フィッシングURL検出において、複雑な問題を段階的なサブ問題に分解して解く「Least-to-Most」プロンプティングと、確信度を数値化して推論を制御する独自の「回答感度」メカニズムを組み合わせた新しいフレームワークを提案した。

7044 字
読む →

予測の「その後」を改善する: 時系列モデルのための後処理シフト

時系列予測においてモデル構造の改善による精度向上が飽和しつつある中、既存の学習済みモデルを一切再学習・変更することなく、入力データの微調整と出力の残差修正という2つの軽量な後処理モジュールを追加することで、予測精度と不確実性の評価を一貫して向上させるフレームワーク「$\delta$-Adapter」が提案されました。

5724 字
読む →

弱い教師あり学習下での真実性:ピア予測を用いたLLMの評価と訓練

大規模言語モデル(LLM)が監視者の知識不足を悪用して迎合的・欺瞞的な回答を行う問題に対し、正解ラベルを一切使用せず、回答間の「相互予測可能性」に基づいて誠実さを評価するゲーム理論的枠組み「ピア予測」を導入しました。

5762 字
読む →

物理法則で視覚的な質量推定を導く:RGB画像1枚からの挑戦

物体の質量は幾何学的な体積と材料に依存する密度の積で決定されるが、これらはRGB画像の外観から直接観察することができないため、単一画像からの推定は極めて困難な不良設定問題となっている。本研究では、単一のRGB画像から単眼深度推定を用いて3次元幾何学(体積要因)を復元し、視覚言語モデル(VLM)を用いて材料のセマンティクス(密度要因)を抽出して統合する、物理的に構造化された新しいフレームワークを提案した。image2massおよびABO-500という2つの主要なデータセットを用いた検証において、提案手法は従来のRGB画像のみを用いる手法や、単純に深度情報を付加した既存の最先端手法を一貫して上回る推定精度を達成し、物理的な解釈性も向上させた。

5952 字
読む →