タグ: cs.LG | Cog AI Archive

AI研究 2026-02-01

サイバー物理システムにおける証明可能な状態の完全性：モジュール型主権が可塑性・安定性のパラドックスを解決する理由

サイバー物理システム（CPS）において、従来の巨大なモノリシックモデルは新しい環境への適応と過去の知識の維持を両立できず、破滅的忘却や高周波の異常検知漏れを引き起こすという課題がある。本論文は「モジュール型主権（Modular Sovereignty）」というパラダイムを提案し、特定の動作領域に特化した凍結済みの小型専門家モデル群（HYDRA）を、不確実性を考慮したガバナーによって統合する手法を提示する。この枠組みは、物理的な不変条件を維持しつつ、各モジュールの独立した検証と監査を可能にすることで、安全性が重視されるシステムにおいて、物理的実体とデジタル表現の間の因果関係を保証する「状態の完全性」を実現する。

5646 字

読む →

AI研究 2026-02-01

音楽盗作検知：問題の定式化とセグメントに基づく解決策

音楽盗作検知を、既存のカバー曲識別やオーディオフィンガープリンティングとは異なる独自の課題として定義し、楽曲全体ではなく部分的な類似性や特定の音楽要素（メロディ、コード、リズム）の模倣を特定する必要性を明確にした。

5870 字

読む →

AI研究 2026-02-01

GeoRC: 地理的位置推定における推論過程を評価するベンチマーク

視覚言語モデル（VLM）は写真の撮影場所を特定する精度で人間に匹敵する能力を見せ始めていますが、その予測に至った根拠を説明する際に、画像内に存在しない情報を捏造するハルシネーションが頻発するという深刻な課題を抱えています。

5845 字

読む →

AI研究 2026-02-01

DUET：効率的に文脈化された教師からの蒸留されたLLMアンラーニング

LLMから不適切な知識を削除するアンラーニングにおいて、従来の学習ベースの手法は計算負荷が高く汎用知識を失いやすい一方で、プロンプトによる手法は攻撃に弱いという課題がありました。本研究が提案するDUETは、プロンプトで制御された教師モデルの振る舞いを生徒モデルに蒸留することで、計算効率を維持しながら特定の知識を正確に削除し、かつモデルのパラメータに直接書き込むことで堅牢性を高めています。既存のベンチマークを用いた検証の結果、DUETは従来手法よりも大幅に少ないデータ量で高い忘却性能と知識保持能力を両立し、リバースエンジニアリング攻撃に対しても強い耐性を持つことが実証されました。

5753 字

読む →

AI研究 2026-02-01

TimeSliver：説明可能な時系列分類のための記号的・線形分解手法

TimeSliverは、生の時系列データと記号的な抽象化表現を統合することで、高い予測精度と忠実な説明可能性を両立させた新しい深層学習フレームワークである。1D CNNによる潜在表現とビン化による記号的表現を線形に結合する独自の構造により、各時間ステップが予測に与える正負の影響を明示的に数値化することに成功している。

5948 字

読む →

AI研究 2026-02-01

信頼性を考慮した早期故障警告のための物理誘導型Tiny-Mamba Transformer

回転機械の早期故障警告において、非定常な運転条件やデータの不均衡、ドメインシフトといった実運用上の課題に対応し、誤報率を厳密に制御しながら迅速な検知を可能にする新しいフレームワーク「PG-TMT」が提案されました。

6196 字

読む →

AI研究 2026-02-01

平均報酬Q学習における新しい収縮原理を用いた$\varepsilon^{-2}$依存性の達成

平均報酬マルコフ決定過程におけるQ学習は、割引報酬設定とは異なりベルマン作用素が収縮性を持たないため、理論的な解析が極めて困難であり、従来のモデルフリー手法では精度誤差に対して最適な収束レートを達成できていませんでした。

5957 字

読む →

AI研究 2026-02-01

モデルベース強化学習における探索の驚くべき困難さ

モデルベース強化学習において、モデルの精度向上や予測誤差の蓄積が最大の課題であるという従来の常識に対し、本論文は検索プロセスそのものに内在する困難さを指摘しています。完璧なモデルや価値関数が存在する場合であっても、検索空間が指数関数的に拡大することで、サンプリングベースの検索では高価値な軌跡を発見できず失敗する可能性があることを理論的に示しています。実証的な分析を通じて、モデルの予測精度が高いことが必ずしも検索による性能向上に直結しないことを明らかにし、むしろ検索によって導入される分布のシフトが価値関数の過大評価を引き起こすことが真のボトルネックであると特定しました。学習済みのポリシーと検索による行動選択の間に生じる乖離が、価値学習の質を著しく低下させ、結果としてエージェントの全体的なパフォーマンスを損なう原因となっているのです。これらの知見に基づき、価値関数のアンサンブルを用いて過大評価を抑制する新しいアルゴリズム「MRS.Q」を提案し、50以上の多様なタスクにおいて従来のモデルベースおよびモデルフリー手法を凌駕する最先端の性能を達成しました。本研究は、モデルの改良だけでなく、検索と価値学習の相互作用を適切に管理することが、モデルベース強化学習の真の可能性を引き出す鍵であることを証明しています。

6907 字

読む →

AI研究 2026-02-01

複数ソースの教師なしドメイン適応に向けた分布頑健な分類手法

本研究は、教師なしドメイン適応（UDA）において、標的ドメインのラベルなしデータが極端に不足している状況や、訓練データに「偽の相関」が含まれる場合に生じる性能低下を克服するための、革新的な分布頑健学習（DRO）フレームワークを提案している。

6613 字

読む →

AI研究 2026-02-01

オンデマンド・エアタクシーサービスのための異種垂直離着陸場選択の最適化：深層強化学習によるアプローチ

都市部の深刻な交通渋滞を解消するため、電動垂直離着陸機（eVTOL）と地上交通を統合管理し、深層強化学習とV2X通信を活用して乗客ごとに最適な離着陸場（バーティポート）を動的に割り当てる「UAGMC」フレームワークを提案しました。

5795 字

読む →

生成AI研究を、要点から追う。

最新の記事

サイバー物理システムにおける証明可能な状態の完全性：モジュール型主権が可塑性・安定性のパラドックスを解決する理由

音楽盗作検知：問題の定式化とセグメントに基づく解決策

GeoRC: 地理的位置推定における推論過程を評価するベンチマーク

DUET：効率的に文脈化された教師からの蒸留されたLLMアンラーニング

TimeSliver：説明可能な時系列分類のための記号的・線形分解手法

信頼性を考慮した早期故障警告のための物理誘導型Tiny-Mamba Transformer

平均報酬Q学習における新しい収縮原理を用いた$\varepsilon^{-2}$依存性の達成

モデルベース強化学習における探索の驚くべき困難さ

複数ソースの教師なしドメイン適応に向けた分布頑健な分類手法

オンデマンド・エアタクシーサービスのための異種垂直離着陸場選択の最適化：深層強化学習によるアプローチ