継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

エネルギーベース生成モデル学習のための拡散分類損失

従来のスコアマッチング手法は、離れた高密度領域間の相対的な重みを正しく推定できない「モード盲目性」という根本的な課題を抱えていたが、本研究はこの問題を解決するために、エネルギーベースモデル(EBM)の学習を異なるノイズレベル間での教師あり分類問題として再定義する新しい目的関数「Diffusive Classification(DiffCLF)」を提案した。 DiffCLFは、モデルにどの時間ステップのノイズが付加されたデータであるかを識別させることで、エネルギー関数とその正規化定数を直接的かつ正確に推定することを可能にし、従来のデノイジング・スコアマッチングと容易に組み合わせることができる軽量で柔軟な枠組みを提供するとともに、理論的にも真の分布を一意に復元できることが証明されている。 ガウス混合モデルを用いた検証や、物理学・化学分野でのボルツマンジェネレーターの構築、複数のモデルを組み合わせる合成タスクにおいて、提案手法は既存のスコアベース手法を上回る高い忠実度と広範な適用性を示し、生成品質の維持と正確なエネルギー値の利用を両立させることで、生成AIの応用範囲を大きく広げる成果を達成した。

5656 字
読む →

平均報酬Q学習における新しい収縮原理を用いた$\varepsilon^{-2}$依存性の達成

平均報酬マルコフ決定過程におけるQ学習は、割引報酬設定とは異なりベルマン作用素が収縮性を持たないため、理論的な解析が極めて困難であり、従来のモデルフリー手法では精度誤差に対して最適な収束レートを達成できていませんでした。

5957 字
読む →

コンフォーマル予測における被覆率・長さ指標への疑問:短い区間がより良いとは限らないとき

従来のコンフォーマル予測(CP)の評価において、実際の値を含む「被覆率」と予測の精密さを示す「平均区間長」の二つの指標だけでは、手法の真の有用性や信頼性を判断するには不十分であることが本研究によって指摘されました。

6106 字
読む →

共形予測における被覆率と区間長指標への疑問:短い区間が必ずしも優れているとは限らない理由

共形予測(CP)の評価で主流の「被覆率」と「区間長」という指標は、特定の確率で空集合を返す「Prejudicial Trick(PT)」という手法によって、統計的な妥当性を維持したまま数値だけを欺瞞的に向上させることが可能です。

6760 字
読む →

微分動的因果ネットワーク:モデル構築、同定、およびグループ比較

脳の大規模な神経相互作用を解明するため、脳波データから直接「微分動的因果ネットワーク(NccDCM)」を構築する新たな手法が提案され、微視的から巨視的なスケールにわたる病態生理学的モデリングの計算上の制約が克服されました。

5780 字
読む →

微分動的因果ネットワーク:モデル構築、同定、およびグループ比較

脳の微視的な神経活動から巨視的な現象までを統合的に理解するため、脳波(EEG)データから直接的に微分因果ネットワークを構築する新しいアプローチであるNccDCMが提案されました。この手法は、相互作用する神経細胞集団の平均的な挙動を記述する条件付き結合神経回路に基づいており、各ノードは局所的な神経システムを、有向エッジはノード間の伝達パラメータを表現しています。 提案されたネットワークは階層構造を持ち、ノードとエッジのパラメータは被験者ごとに変動しつつも混合効果モデルに従うよう設計されており、確率微分方程式のチェン・フリース展開を用いた進化的最適化アルゴリズムによって効率的なパラメータ推論を実現しています。この枠組みにより、大規模な神経接続のモデル化に伴う計算上の課題を克服し、個々の脳の異質性を考慮した解析が可能となりました。 実際の小児てんかん患者と対照群のEEGデータを用いた検証では、てんかん発作時および発作前における興奮性・抑制性介在ニューロンの不均衡や、脳内ネットワークの機能的断絶、および異常な結合パターンの変化を特定することに成功しました。この結果は、てんかんの病態メカニズムの解明や、脳活動のバイオマーカーとしての有効性を示唆しており、臨床的な診断や治療戦略の策定に寄与する可能性を秘めています。

6099 字
読む →

費用対効果の向上:Reset and Discard (ReD) を用いた固定予算における大規模言語モデルの推論の向上

大規模言語モデル(LLM)の性能評価を、従来の1問あたりの成功率(pass@k)から、限られた総予算内で解決できるユニークな問題数(coverage@cost)へと転換することを提案しています。

5922 字
読む →

費用対効果の向上:Reset and Discard (ReD) を用いた固定予算下での大規模言語モデルの推論の改善

大規模言語モデル(LLM)の推論において、従来は1回でも正解する確率を示すpass@kが重視されてきましたが、実運用では限られた予算内でいくつの異なる問題を解決できるかというcoverage@costがより重要な指標となります。

5749 字
読む →

Adamの$\beta_1 = \beta_2$設定が優れている理由:勾配スケール不変性の原理

Adamのハイパーパラメータである$\beta1$と$\beta2$を等しく設定することで、訓練の安定性と精度が向上するという経験的事実に対し、「勾配スケール不変性」という新たな理論的枠組みを導入して数学的な解明を行った。

5868 字
読む →

ECSEL: シグノミアル方程式学習による説明可能な分類手法

ECSELは、物理法則に多く見られる「シグノミアル方程式」という数式形式を学習モデルに採用することで、高い予測精度と人間が直接読み解ける透明性を両立した新しい分類手法である。 従来の記号回帰手法が抱えていた膨大な計算コストという課題を、勾配ベースの最適化とL1正則化を組み合わせることで解決し、既存の最先端手法を上回る数式復元率と劇的な計算時間の短縮を達成した。 学習された数式からは、特徴量の変化が予測に与える影響を弾力性や反実仮想推論といった数学的指標で直接算出でき、不正検知や電子商取引などの実務において根拠に基づいた意思決定を強力に支援する。

5685 字
読む →