タグ: cs.LG | Cog AI Archive

AI研究 2026-01-29

K-Myriad: 教師なし並列エージェントによる強化学習のジャンプスタート

K-Myriadは、大規模な並列環境において複数のエージェントを教師なしで学習させ、集合的な状態エントロピーを最大化することで強化学習の初期探索を効率化する新しい手法である。共有のネットワーク基盤と独立した複数の政策ヘッドを組み合わせたスケーラブルなアーキテクチャにより、高次元の連続制御タスクにおいて多様な専門的探索戦略を同時に構築することが可能である。事前学習された多様な政策集団を初期値として利用することで、未知の報酬タスクにおける学習効率を大幅に向上させ、ランダムな初期化や単一の汎用的政策を超える性能を発揮することを実証した。この手法は、並列計算リソースを単なる高速化の手段としてだけでなく、探索の質を向上させるための戦略的な資産として活用する道を開くものである。

6186 字

読む →

AI研究 2026-01-29 長文

負債としての安定性：LLMにおける言語構造の体系的崩壊

大規模言語モデルの学習において、従来は最適化の必須条件とされていた「学習の安定性」が、実は生成される言語構造の体系的な崩壊を招く「負債」となり得ることを、理論的証明と実験的検証の両面から明らかにしました。

7638 字

読む →

AI研究 2026-01-29

常識的アブダクション論理のためのバランスの取れたニューロシンボリックアプローチ

大規模言語モデル（LLM）の柔軟な知識とロジックソルバーの厳密な推論を融合させ、問題文に明示されていない常識的な前提知識を動的に補完しながら推論を行う新手法「ARGOS」が開発されました。この手法は、ロジックソルバーから得られる論理的基盤（バックボーン）をフィードバックとして活用し、LLMが不足している常識的な関係性を反復的に生成・検証することで、従来の演繹的手法では解決困難だった不完全な情報を含む問題に対応します。複数の論理推論ベンチマークを用いた検証において、ARGOSは既存のニューラル手法やシンボリック手法を安定して上回る精度を達成し、人間のようなアブダクション（仮説生成）推論が複雑な論理課題の解決に極めて有効であることを実証しました。

5843 字

読む →

AI研究 2026-01-29

PolySHAP：交互作用を考慮した多項式回帰によるKernelSHAPの拡張

PolySHAPは、機械学習モデルの説明手法であるKernelSHAPを拡張し、特徴量間の複雑な交互作用を多項式回帰によってモデル化することで、シャプレイ値の推定精度を大幅に向上させる新しいアルゴリズムである。

5827 字

読む →

AI研究 2026-01-29

CASSANDRA：確率的世界モデリングのためのプログラム的かつ確率的な学習と推論

CASSANDRAは、ビジネスドメインのような決定論的挙動と確率的挙動が混在する複雑な環境において、LLMが生成するコードと確率的グラフィカルモデル（PGM）を統合した新しいニューロシンボリックな世界モデル構築手法である。

6061 字

読む →

AI研究 2026-01-29

深層強化学習における自然方策勾配のためのフィッシャー逆行列のランク1近似

深層強化学習における自然方策勾配法（NPG）は、学習の収束が早く幾何学的に適切な更新が可能である一方、フィッシャー情報行列（FIM）の逆行列計算にパラメータ数の3乗という膨大な計算コストがかかる点が実用上の大きな障壁となっていました。

6974 字

読む →

AI研究 2026-01-29

物理法則に基づく不確実性が信頼性の高いAI主導の設計を実現する

次世代通信（5G/6G）に不可欠なメタサーフェス設計において、従来のAI代理モデルは学習データが不足する領域で「偽の最適解」を提示する課題がありましたが、本研究は予測が物理法則（電磁場の連続性）にどれだけ違反しているかを不確実性の指標とする「物理法則に基づく不確実性（PHY-UNC）」を提案しました。

6400 字

読む →

AI研究 2026-01-29 長文

コルモゴロフ・アーノルド・ネットワークにおけるグリッド適応のための動的フレームワーク

本研究は、コルモゴロフ・アーノルド・ネットワーク（KAN）の学習において、グリッドのノット配置を最適化するための「重要度密度関数（IDF）」に基づく新しい動的フレームワークを提案しました。従来の入力データの密度のみに依存する手法とは異なり、関数の幾何学的複雑さや学習中のダイナミクスを反映させるため、出力の曲率（2階偏導関数の和）を指標としてノットを再配置する戦略を導入しています。合成関数、Feynmanデータセット、および物理情報機械学習（PIML）を用いた検証の結果、提案手法は従来手法と比較して相対誤差を平均で9.4%から25.3%削減し、計算コストの増加を最小限に抑えつつ高い精度と安定性を実現したことが確認されました。

7137 字

読む →

AI研究 2026-01-29

準モンテカルロ法は極めて低次元の深層生成モデルを実現する

準モンテカルロ法（QMC）を活用した新しい深層生成モデル「QLVM」は、わずか1次元から3次元という極めて低次元な潜在空間において、従来の変分オートエンコーダ（VAE）や重要度重み付けオートエンコーダ（IWAE）を凌駕する性能を発揮します。

6160 字

読む →

AI研究 2026-01-29

ハードウェアトロイ検出のための説明可能性手法：体系的な比較

本研究は、ゲートレベルでのハードウェア・トロイの木馬検出において、ドメイン知識を活用した属性分析、事例ベース推論、モデル非依存の重要度算出という3つの説明可能AI（XAI）手法を系統的に比較し、実務的な有用性を検証しました。

6194 字

読む →

生成AI研究を、要点から追う。

最新の記事

K-Myriad: 教師なし並列エージェントによる強化学習のジャンプスタート

負債としての安定性：LLMにおける言語構造の体系的崩壊

常識的アブダクション論理のためのバランスの取れたニューロシンボリックアプローチ

PolySHAP：交互作用を考慮した多項式回帰によるKernelSHAPの拡張

CASSANDRA：確率的世界モデリングのためのプログラム的かつ確率的な学習と推論

深層強化学習における自然方策勾配のためのフィッシャー逆行列のランク1近似

物理法則に基づく不確実性が信頼性の高いAI主導の設計を実現する

コルモゴロフ・アーノルド・ネットワークにおけるグリッド適応のための動的フレームワーク

準モンテカルロ法は極めて低次元の深層生成モデルを実現する

ハードウェアトロイ検出のための説明可能性手法：体系的な比較