Cog AI Archive

AI研究 2026-02-01

DUET：効率的に文脈化された教師からの蒸留されたLLMアンラーニング

LLMから不適切な知識を削除するアンラーニングにおいて、従来の学習ベースの手法は計算負荷が高く汎用知識を失いやすい一方で、プロンプトによる手法は攻撃に弱いという課題がありました。本研究が提案するDUETは、プロンプトで制御された教師モデルの振る舞いを生徒モデルに蒸留することで、計算効率を維持しながら特定の知識を正確に削除し、かつモデルのパラメータに直接書き込むことで堅牢性を高めています。既存のベンチマークを用いた検証の結果、DUETは従来手法よりも大幅に少ないデータ量で高い忘却性能と知識保持能力を両立し、リバースエンジニアリング攻撃に対しても強い耐性を持つことが実証されました。

5753 字

読む →

AI研究 2026-02-01

Drive-KD: 自動運転VLMのためのマルチティーチャー知識蒸留

Drive-KDは、自動運転における視覚言語モデル（VLM）の効率化を実現するため、知覚・推論・計画という3つの能力に分解して大規模モデルから小規模モデルへ知識を転移する新しい蒸留フレームワークである。

5906 字

読む →

AI研究 2026-02-01

TimeSliver：説明可能な時系列分類のための記号的・線形分解手法

TimeSliverは、生の時系列データと記号的な抽象化表現を統合することで、高い予測精度と忠実な説明可能性を両立させた新しい深層学習フレームワークである。1D CNNによる潜在表現とビン化による記号的表現を線形に結合する独自の構造により、各時間ステップが予測に与える正負の影響を明示的に数値化することに成功している。

5948 字

読む →

AI研究 2026-02-01

信頼性を考慮した早期故障警告のための物理誘導型Tiny-Mamba Transformer

回転機械の早期故障警告において、非定常な運転条件やデータの不均衡、ドメインシフトといった実運用上の課題に対応し、誤報率を厳密に制御しながら迅速な検知を可能にする新しいフレームワーク「PG-TMT」が提案されました。

6196 字

読む →

AI研究 2026-02-01

平均報酬Q学習における新しい収縮原理を用いた$\varepsilon^{-2}$依存性の達成

平均報酬マルコフ決定過程におけるQ学習は、割引報酬設定とは異なりベルマン作用素が収縮性を持たないため、理論的な解析が極めて困難であり、従来のモデルフリー手法では精度誤差に対して最適な収束レートを達成できていませんでした。

5957 字

読む →

AI研究 2026-02-01

モデルベース強化学習における探索の驚くべき困難さ

モデルベース強化学習において、モデルの精度向上や予測誤差の蓄積が最大の課題であるという従来の常識に対し、本論文は検索プロセスそのものに内在する困難さを指摘しています。完璧なモデルや価値関数が存在する場合であっても、検索空間が指数関数的に拡大することで、サンプリングベースの検索では高価値な軌跡を発見できず失敗する可能性があることを理論的に示しています。実証的な分析を通じて、モデルの予測精度が高いことが必ずしも検索による性能向上に直結しないことを明らかにし、むしろ検索によって導入される分布のシフトが価値関数の過大評価を引き起こすことが真のボトルネックであると特定しました。学習済みのポリシーと検索による行動選択の間に生じる乖離が、価値学習の質を著しく低下させ、結果としてエージェントの全体的なパフォーマンスを損なう原因となっているのです。これらの知見に基づき、価値関数のアンサンブルを用いて過大評価を抑制する新しいアルゴリズム「MRS.Q」を提案し、50以上の多様なタスクにおいて従来のモデルベースおよびモデルフリー手法を凌駕する最先端の性能を達成しました。本研究は、モデルの改良だけでなく、検索と価値学習の相互作用を適切に管理することが、モデルベース強化学習の真の可能性を引き出す鍵であることを証明しています。

6907 字

読む →

AI研究 2026-02-01

複数ソースの教師なしドメイン適応に向けた分布頑健な分類手法

本研究は、教師なしドメイン適応（UDA）において、標的ドメインのラベルなしデータが極端に不足している状況や、訓練データに「偽の相関」が含まれる場合に生じる性能低下を克服するための、革新的な分布頑健学習（DRO）フレームワークを提案している。

6613 字

読む →

AI研究 2026-02-01

オンデマンド・エアタクシーサービスのための異種垂直離着陸場選択の最適化：深層強化学習によるアプローチ

都市部の深刻な交通渋滞を解消するため、電動垂直離着陸機（eVTOL）と地上交通を統合管理し、深層強化学習とV2X通信を活用して乗客ごとに最適な離着陸場（バーティポート）を動的に割り当てる「UAGMC」フレームワークを提案しました。

5795 字

読む →

AI研究 2026-02-01

最適輸送理論に基づくサンプル生成による分布外データの過剰適合抑制

深層学習モデルが未知のデータ（分布外データ）に対して根拠のない高い確信度を持つ「過剰適合」の問題に対し、半離散最適輸送理論の幾何学的構造を利用して、意味的に曖昧な境界領域を特定し制御する新しい学習フレームワークが提案されました。

6472 字

読む →

AI研究 2026-02-01

人間を模倣した推論によるホワイトボックス・オペアンプ設計

アナログ回路の基本要素である演算増幅器（オペアンプ）の設計において、従来のベイズ最適化などのブラックボックス手法は物理的根拠に乏しく、設計意図が不明確であるため、下流のトランジスタレベルへの移行時に設計不備や失敗を招くという課題がありました。

6407 字

読む →

生成AI研究を、要点から追う。

最新の記事

DUET：効率的に文脈化された教師からの蒸留されたLLMアンラーニング

Drive-KD: 自動運転VLMのためのマルチティーチャー知識蒸留

TimeSliver：説明可能な時系列分類のための記号的・線形分解手法

信頼性を考慮した早期故障警告のための物理誘導型Tiny-Mamba Transformer

平均報酬Q学習における新しい収縮原理を用いた$\varepsilon^{-2}$依存性の達成

モデルベース強化学習における探索の驚くべき困難さ

複数ソースの教師なしドメイン適応に向けた分布頑健な分類手法

オンデマンド・エアタクシーサービスのための異種垂直離着陸場選択の最適化：深層強化学習によるアプローチ

最適輸送理論に基づくサンプル生成による分布外データの過剰適合抑制

人間を模倣した推論によるホワイトボックス・オペアンプ設計