タグ: AI | Cog AI Archive

AI研究 2026-02-04

公平なアクセスと不平等な対話：LLMの公平性に関する反事実的監査

本研究は、大規模言語モデル（LLM）の公平性評価において、従来の「回答を拒否するかどうか」というアクセス段階の指標だけでは不十分であり、回答が提供された後の「対話の質」に潜む格差を検証する必要性を提唱している。 GPT-4とLLaMA3.

5744 字

読む →

AI研究 2026-02-04

統一的ヒューマノイド全身制御のための身体性を考慮したジェネラリスト・スペシャリスト蒸留

本研究は、構造の異なる複数のヒューマノイドを単一のポリシーで制御する学習フレームワーク「EAGLE」を開発し、歩行だけでなく、しゃがむ、傾くといった多様な全身動作を、ロボットごとの報酬調整なしで実現した。

6135 字

読む →

AI研究 2026-02-04

規範と参照が衝突する場所：規範的推論におけるLLMの評価

ロボットなどのエージェントが人間と円滑に意思疎通を図るためには、物理的および社会的な文脈に基づいた「社会規範」を理解し、曖昧な指示から意図された対象物を特定する能力（NBRR）が不可欠であるが、現在のLLMがこの能力をどの程度備えているかは不明であった。

6618 字

読む →

AI研究 2026-02-04

マルコフ決定過程における幾何学的整合性を用いた価値表現の構造化

強化学習における時間差分（TD）学習は、関数近似や分布の変動によって学習が不安定になり、発散や振動を引き起こすという課題を抱えていますが、本研究は順序論の視点から価値関数を半順序集合（poset）として再構成するGCR-RLを提案し、幾何学的な整合性を強制することで学習の安定化と高速化を実現しました。

5821 字

読む →

AI研究 2026-02-04

LLMの因果推論におけるバイアスと人間との比較分析

20種類以上の大規模言語モデル（LLM）を対象に、衝突構造（C1→E←C2）を用いた11の因果推論タスクで人間と比較した結果、LLMは人間よりも提示されたルールに極めて厳格に従う傾向があることが判明しました。

6314 字

読む →

AI研究 2026-02-04

NLI: 非一様線形補間による非線形演算の近似を用いた効率的なLLM推論

大規模言語モデル（LLM）の推論において、SiLUやSoftmaxなどの非線形演算は計算負荷が高く、従来の近似手法では広範な入力値に対応できず精度が崩壊する課題があったが、本研究は動的計画法を用いて最適な区切り点を選択する「非一様線形補間（NLI）」を提案した。

5720 字

読む →

AI研究 2026-02-04 長文

大規模言語モデルは推論時の計画において誤った第一歩を踏み出す可能性がある

大規模言語モデル（LLM）は学習を通じて高度なシーケンスレベルの計画能力を獲得しているが、推論時には人間が作成したプロンプトとモデル内部の言語表現の乖離により、一時的に短期的で不整合な計画行動を示す。

7476 字

読む →

AI研究 2026-02-04

Agent Alpha: コンピュータ操作エージェントのための生成・探索・評価を統合する木探索

Agent Alphaは、マルチモーダル大規模言語モデル（MLLM）の生成、探索、評価の能力をステップレベルのモンテカルロ木探索（MCTS）によって統合した、コンピュータ操作エージェント（CUA）のための革新的なフレームワークである。

6378 字

読む →

AI研究 2026-02-04

確率的符号およびスペクトル降下法のための非ユークリッド勾配ノイズスケールを用いた適応的バッチサイズ

従来の適応的バッチサイズ制御はSGDのユークリッド幾何学を前提としていたが、本研究ではsignSGDやspecSGD（Muon）といった非ユークリッド幾何学を用いる最適化手法に対応した新しい勾配ノイズスケール（GNS）を導出した。

5855 字

読む →

AI研究 2026-02-04

微分可能な社会的選択：学習メカニズム、意思決定、およびアライメントにおける手法と未解決問題

社会的選択理論は、従来の政治学や経済学の枠を超え、現代の機械学習システムにおける基礎的な構成要素へと進化しています。オークション、資源配分、大規模言語モデルのアライメントといった現代のシステムは、多様な選好やインセンティブを集合的な決定へと統合するプロセスを内包していますが、従来の公理的な手法では、現代の複雑で大規模なデータ分布に十分に対応できないという課題がありました。これに対し、投票ルールやインセンティブ設計を微分可能なニューラルアーキテクチャとしてパラメータ化し、データから最適化する「微分可能な社会的選択」という新たなパラダイムが登場しています。このアプローチでは、損失関数が暗黙の集計ルールとして機能し、匿名性や実現可能性といった社会的選択の公理が、ネットワークの構造的なバイアスや制約として組み込まれます。本レビューでは、オークション、投票、参加型予算編成、流動民主主義、AIアライメント、逆メカニズム学習の6つの領域を統合し、古典的な不可能性定理や公理的なトレードオフが、学習の目的関数や最適化のダイナミクスの中にどのように再配置されるかを明らかにしています。さらに、インセンティブの保証、分布の変化に対する堅牢性、学習されたメカニズムの監査可能性、多元的な選好集計など、36個の具体的な未解決問題を提示し、新しい研究アジェンダを定義しています。

6504 字

読む →

生成AI研究を、要点から追う。

最新の記事

公平なアクセスと不平等な対話：LLMの公平性に関する反事実的監査

統一的ヒューマノイド全身制御のための身体性を考慮したジェネラリスト・スペシャリスト蒸留

規範と参照が衝突する場所：規範的推論におけるLLMの評価

マルコフ決定過程における幾何学的整合性を用いた価値表現の構造化

LLMの因果推論におけるバイアスと人間との比較分析

NLI: 非一様線形補間による非線形演算の近似を用いた効率的なLLM推論

大規模言語モデルは推論時の計画において誤った第一歩を踏み出す可能性がある

Agent Alpha: コンピュータ操作エージェントのための生成・探索・評価を統合する木探索

確率的符号およびスペクトル降下法のための非ユークリッド勾配ノイズスケールを用いた適応的バッチサイズ

微分可能な社会的選択：学習メカニズム、意思決定、およびアライメントにおける手法と未解決問題