タグ: cs.LG | Cog AI Archive

AI研究 2026-02-04

Neural Attention Search Linear：適応的なトークンレベルのハイブリッド・アテンション・モデルに向けて

従来のTransformerが抱える計算量の課題と線形アテンションの表現力の限界を解決するため、同一レイヤー内でトークンごとに最適な演算を適応的に選択するフレームワーク「NAtS-L」が開発されました。

6201 字

読む →

AI研究 2026-02-04

LLMに触発された事前学習と微調整による小規模データ・大規模最適化手法の提案

本研究は、少数のデータ点しか得られない大規模な意思決定問題に対し、大規模言語モデル（LLM）の成功に触発された「事前学習と微調整（Pretrain-then-Finetune）」という新しい枠組みを提案している。

5840 字

読む →

AI研究 2026-02-04

複数回の更新を伴う一般化された知識編集のための競合解消およびシャープネスを考慮した最小化

大規模言語モデルの内部知識を効率的に更新する手法として、モデル編集やLoRAなどのパラメータ効率的な微調整が検討されてきましたが、入力形式の変化への弱さや複数回の更新における不安定さ、そして古い知識との衝突が実用上の大きな課題となっていました。

5900 字

読む →

AI研究 2026-02-04

石油井におけるLSTMと転移学習を用いた坑底圧力推定のためのソフトセンサ

石油生産の最適化と安全管理に不可欠な坑底圧力（BHP）を、高コストで故障しやすい物理センサに頼らず、地上の計測データから高精度に推定する「ソフトセンサ」を開発した。深層学習のLSTMモデルを採用し、さらに大規模油田で学習した知識を別の油田へ適用する「転移学習」を導入することで、データが不足している環境や異なる運用条件下でも、平均絶対誤差率（MAPE）2%未満という極めて高い推定精度を達成した。ブラジルのプレソルト油田における13年間の膨大な実データを用いた検証により、複雑な多相流条件下でも従来の経験式や標準的なニューラルネットワークを凌駕する性能が確認され、物理センサの代替やデジタルツインへの応用によるコスト削減と運用効率化が期待される。

5886 字

読む →

AI研究 2026-02-04

視覚誘導型音響ハイライティングのための条件付きフローマッチング

映像の視覚情報に基づいて音声のバランスを調整する「視覚誘導型音響ハイライティング（VisAH）」において、従来の識別モデルの限界を克服するため、生成モデルである条件付きフローマッチング（CFM）を用いた新手法「VisAH-FM」を提案した。

5935 字

読む →

AI研究 2026-02-04

UniGeM: 幾何学的探索とマイニングによるデータ混合と選択の統合

大規模言語モデルの学習においてデータの質がボトルネックとなる中、従来のドメイン混合（マクロ）とサンプル選択（ミクロ）を個別に扱う手法では、コードのような厳密な論理構造を持つデータの整合性が損なわれるという課題があった。

6697 字

読む →

AI研究 2026-02-04

Reasoning Cache: 短いホライゾンの強化学習による長期間の継続的な改善

Reasoning Cache（RC）は、推論プロセスを要約して「キャッシュ」として保持し、次の推論をその要約に基づいて行う反復的なデコードアルゴリズムであり、従来の自己回帰型デコードが抱えていた「訓練時の長さを超えると性能が劣化する」という限界を打破することに成功しました。

6174 字

読む →

AI研究 2026-02-04

タスク属性評価のためのカーネル代理モデルの効率的な推定手法

現代のAI学習において、多数の学習タスクが特定の目標タスクに与える影響を解明する「タスク属性評価」は、計算コストとタスク間の複雑な非線形相互作用（相乗効果や反作用）が障壁となっていました。本研究は、従来の線形モデルでは捉えられなかったこれらの非線形関係を、放射基底関数（RBF）カーネルを用いた「カーネル代理モデル（KERNELSM）」によってモデル化し、さらに事前学習済みモデルの勾配情報を活用した「再学習不要」の高速な推定アルゴリズムを開発しました。検証の結果、提案手法は既存の線形モデルや影響関数と比較して、真値である再学習結果との相関を25%向上させ、コンテキスト内学習や多目的強化学習におけるデモンストレーション選択の精度を40%改善することに成功しました。

6898 字

読む →

AI研究 2026-02-04 長文

「エージェントを増やしても伸びない」理由を、多様性から解き明かす

エージェントを16人に増やせば、LLMはもっと賢くなるはず……本当に？直感的には“人手”が増えるほど強くなりそうですが、意外にも、同じようなエージェントを増やすほど伸びが止まり、「多様性」だけが伸びしろを残します。

7564 字

読む →

AI研究 2026-02-04 長文

管内データで束ねた燃料集合体の限界熱流束を当てにいく：CTF×ハイブリッド機械学習の一般化検証

管（チューブ）で学習したモデルは、燃料棒が束になった「ロッドバンドル」でも通用するのか？意外なのは、複雑さが一気に増えるのに「追加データが足りない」という現実が、手法の選び方だけでなく、“勝ち筋の描き方”そのものを変えさせる点です。

8097 字

読む →

生成AI研究を、要点から追う。

最新の記事

Neural Attention Search Linear：適応的なトークンレベルのハイブリッド・アテンション・モデルに向けて

LLMに触発された事前学習と微調整による小規模データ・大規模最適化手法の提案

複数回の更新を伴う一般化された知識編集のための競合解消およびシャープネスを考慮した最小化

石油井におけるLSTMと転移学習を用いた坑底圧力推定のためのソフトセンサ

視覚誘導型音響ハイライティングのための条件付きフローマッチング

UniGeM: 幾何学的探索とマイニングによるデータ混合と選択の統合

Reasoning Cache: 短いホライゾンの強化学習による長期間の継続的な改善

タスク属性評価のためのカーネル代理モデルの効率的な推定手法

「エージェントを増やしても伸びない」理由を、多様性から解き明かす

管内データで束ねた燃料集合体の限界熱流束を当てにいく：CTF×ハイブリッド機械学習の一般化検証