タグ: cs.LG | Cog AI Archive

AI研究 2026-01-29

GreenServ：マルチモデルLLM推論のためのエネルギー効率に優れたコンテキスト認識型動的ルーティング

GreenServは、大規模言語モデル（LLM）の推論における膨大なエネルギー消費を削減するために開発された、動的でコンテキストを認識するルーティングフレームワークである。各クエリからタスクの種類や意味的クラスタ、テキストの複雑性などの軽量な特徴を抽出し、文脈付き多腕バンディット（MAB）アルゴリズムを用いて、精度とエネルギー効率のバランスが最も優れたモデルを複数の候補から自動的に選択する。このシステムは、従来の静的なモデル選択とは異なり、実際の運用を通じてモデルの性能を学習し続けるオンライン学習機能を備えている。これにより、事前の膨大なキャリブレーションを必要とせず、新しいモデルが追加された際にも即座に最適なルーティング戦略に組み込むことが可能となっている。実験の結果、ランダムなルーティングと比較して精度を22%向上させつつ、累積エネルギー消費を31%削減することに成功した。また、推論時のオーバーヘッドは極めて小さく、実用的な遅延制約を満たしながら、持続可能なAI運用のための高度なトレードオフ制御を実現している。

5646 字

読む →

AI研究 2026-01-29

条件付き遷移推定とオンライン行動アライメントによる汎化可能な模倣学習に向けて

本研究は、行動ラベルのない観察データのみから学習を行う新しい模倣学習手法「UfO（Unsupervised Imitation Learning from Observation）」を提案し、従来の手法が抱えていた「行動ベースの教師あり学習への依存」や「特定の状態には単一の最適行動しかないという誤った仮定」を排除することに成功した。 UfOは、方策モデルと生成モデルを相互に最適化する「再構成ステージ」と、状態の差分を利用して行動を微調整する「敵対的ステージ」の二段階構成を採用しており、これにより教師データの行動を盲目的に模倣するのではなく、環境の因果構造を理解した上での柔軟な学習を可能にしている。 5つの標準的なシミュレーション環境を用いた検証において、UfOは教師モデルの性能を上回るスコアを記録しただけでなく、標準偏差を最小限に抑えることで未知のシナリオに対する極めて高い汎化性能を実証し、観察のみによる無人模倣学習の新たな基準を確立した。

5963 字

読む →

AI研究 2026-01-29

ME-WARD：職場における慣性およびビデオデータからの筋骨格系リスク評価のためのマルチモーダル人間工学分析ツール

ME-WARDは、慣性計測装置（IMU）とビデオベースのポーズ推定技術を統合し、上肢の姿勢評価手法であるRULAをデジタル化することで、職場における筋骨格系疾患のリスクを自動かつ客観的に評価するマルチモーダルな分析システムである。

6219 字

読む →

AI研究 2026-01-29

GenAI-Net：自動化された生体分子ネットワーク設計のための生成AIフレームワーク

GenAI-Netは、特定の動的機能を持つ生体分子ネットワークの設計を自動化する生成AIフレームワークであり、反応を提案するAIエージェントとシミュレーションによる評価をループ状に結合することで、複雑な設計課題を効率的に解決するシステムである。

6249 字

読む →

AI研究 2026-01-29

深層内発的驚き正則化制御（DISRC）：疎な環境における効率的な深層Q学習のための生物学に着想を得た機構

従来の深層Q学習（DQN）は固定された学習率や一律の更新スケールに依存するため、報酬が稀な「疎な報酬環境」では学習が不安定になり収束が遅れるという課題がありましたが、本研究は脳のドーパミンによる学習調整機能に着想を得た「深層内発的驚き正則化制御（DISRC）」を提案しました。

6706 字

読む →

AI研究 2026-01-29 長文

ToS: 動画内の距離推定を伴うステレオ音響イベントの定位と検出のためのスペシャリストチーム・アンサンブルフレームワーク

音響イベントの検出、定位、距離推定を同時に行う3D SELDは、意味（何が）、空間（どこで）、時間（いつ）という3つの次元を統合的に推論する必要があり、単一のモデルではこれら全ての要素を最適化することが困難という課題がありました。

7300 字

読む →

AI研究 2026-01-29

Athena：オンライン強化学習によるデータプリフェッチとオフチップ予測の相乗化

Athena（アテナ）は、プロセッサのメモリ遅延を隠蔽するためのデータプリフェッチとオフチップ予測（OCP）を、オンライン強化学習を用いて自律的に調整する革新的なフレームワークである。ワークロードのフェーズ変化によるノイズと自身の行動による真の成果を分離する独自の「複合報酬フレームワーク」を導入したことで、学習の安定性を飛躍的に高め、多様なシステム構成において既存手法を最大10.3%上回る性能向上を達成した。特定のアルゴリズムに依存しない汎用性を持ちながら、1コアあたりわずか3KBという極めて小さなハードウェアコストで実装可能であり、現代の高性能プロセッサにおけるメモリシステムの最適化に新たな道を示している。

5754 字

読む →

AI研究 2026-01-29

Split-on-Share：タスク非依存な継続学習のためのスパースな専門家混合モデル

大規模言語モデル（LLM）の継続学習において、新しい知識の習得（可塑性）と過去の知識の保持（安定性）を両立させるため、モデルをモジュール化された部分空間に分解する新フレームワーク「SETA」が提案されました。

6372 字

読む →

AI研究 2026-01-29

RPNT：堅牢な事前学習済みニューラル・トランスフォーマー ―― 汎用的な運動デコーディングへの道筋

脳活動を解釈して行動へと翻訳する脳デコードにおいて、異なるセッション、被験者、記録部位、行動タイプといった多様なバリエーションを越えて汎化可能な新しいモデル「RPNT」が提案されました。このモデルは、実験メタデータを統合する多次元回転位置埋め込み（MRoPE）、神経活動の非定常性に対処するコンテキストベースのアテンション、そして一様ランダムマスキングを用いた自己教師あり学習という独自の構成要素を備えています。非ヒト霊長類の運動データセットを用いた検証により、RPNTはセッション間や被験者間を跨ぐデコードタスクにおいて既存のモデルを一貫して上回る性能を示し、脳コンピュータインターフェースの発展に寄与する可能性を証明しました。

5701 字

読む →

AI研究 2026-01-29

北極海の海氷力学における短期変動の因果効果を定量化するための時変因果処理

北極海における海氷厚さと海面水位（SSH）の複雑な因果関係を解明するため、物理的知見と変分オートエンコーダーを融合させた新開発のフレームワーク「KGCM-VAE」が提案されました。このモデルは、流速信号をシグモイド関数で動的に調整する処理生成、潜在空間での分布の偏りを正すMMD、そして物理構造を反映した因果隣接行列によるデコーダー制約を組み合わせることで、観測データからの高精度な因果推論を実現しています。実際の北極海観測データを用いた検証では、既存の最先端手法を凌駕する推定精度を記録し、特に因果隣接制約と分布調整の相乗効果によって推定誤差を1.88%削減することに成功しており、気候変動予測の精緻化に大きく寄与する成果となっています。

5679 字

読む →

生成AI研究を、要点から追う。

最新の記事

GreenServ：マルチモデルLLM推論のためのエネルギー効率に優れたコンテキスト認識型動的ルーティング

条件付き遷移推定とオンライン行動アライメントによる汎化可能な模倣学習に向けて

ME-WARD：職場における慣性およびビデオデータからの筋骨格系リスク評価のためのマルチモーダル人間工学分析ツール

GenAI-Net：自動化された生体分子ネットワーク設計のための生成AIフレームワーク

深層内発的驚き正則化制御（DISRC）：疎な環境における効率的な深層Q学習のための生物学に着想を得た機構

ToS: 動画内の距離推定を伴うステレオ音響イベントの定位と検出のためのスペシャリストチーム・アンサンブルフレームワーク

Athena：オンライン強化学習によるデータプリフェッチとオフチップ予測の相乗化

Split-on-Share：タスク非依存な継続学習のためのスパースな専門家混合モデル

RPNT：堅牢な事前学習済みニューラル・トランスフォーマー ―― 汎用的な運動デコーディングへの道筋

北極海の海氷力学における短期変動の因果効果を定量化するための時変因果処理