AI研究 | Cog AI Archive

AI研究 2026-02-01

高速かつ信頼性の高い形状最適化のための不確実性を考慮したデータに基づく手法

航空機設計におけるデータ駆動型最適化（DBO）は、学習済みモデルを用いて高速な評価を可能にするが、学習データの範囲外の形状に対してモデルが「過信」による楽観的な予測誤差を犯し、信頼性の低い設計結果を導くという重大な課題があった。

6378 字

読む →

AI研究 2026-02-01

ウェブエージェントは見た目に左右されるか？UIデザイン要因の包括的評価

本研究は、視覚と言語を統合したVLMベースのウェブエージェントが、ウェブページ上の視覚的属性（色、サイズ、配置など）からどのような影響を受けて意思決定を行うかを定量的に評価するパイプライン「VAF」を提案しました。

6336 字

読む →

AI研究 2026-02-01

産業化された欺瞞：LLMによる誤情報がデジタルエコシステムに与える付随的影響

生成AIの進化により、誤情報の生成が「産業化された欺瞞」へと変貌し、デジタルエコシステムの信頼性を根本から揺るがす深刻な事態となっている。本研究では、AI生成ニュースに対する人間の認識を評価する「JudgeGPT」と、研究用の刺激生成エンジンである「RogueGPT」を提案し、実験的なパイプラインを構築した。

5879 字

読む →

AI研究 2026-02-01

トークンからブロックへ：分子生成におけるブロック拡散の視点

従来の分子言語モデルが直面していた「グラフ構造の把握不足」と「標的タンパク質への適応性欠如」を解決するため、SMILESを固定長のブロックに分割する「ソフトフラグメント」表現と、局所的な双方向拡散と自己回帰生成を融合させた世界初のブロック拡散モデル「SoftBD」を提案しました。

5839 字

読む →

AI研究 2026-02-01

古典的計画におけるドメインモデル設計のエネルギーへの影響

AI計画法において、アルゴリズムとは独立して定義されるドメインモデルの設計が、システムの消費エネルギーに極めて大きな影響を及ぼすことを、5つのプランナーと5つのベンチマークを用いた実験により明らかにした。

5887 字

読む →

AI研究 2026-02-01

OVD: 教師モデルの言語スコアを活用した効率的なオンポリシー蒸留手法

従来の知識蒸留は、教師モデルの全語彙にわたる確率分布を生徒モデルに一致させる必要があり、膨大なメモリ消費と生徒の探索能力の制限が大きな課題となっていた。本研究が提案する「OVD（オンポリシー言語蒸留）」は、詳細なロジット情報の代わりに教師モデルが出力する0から9の離散的な言語スコアを用いた軌跡マッチングを行うことで、メモリ消費を劇的に削減しつつ、生徒モデルが自身の分布に基づいた自由な探索を行うことを可能にする。Web質問応答や数学的推論タスクにおける実験の結果、OVDは既存手法を大幅に上回る性能を示し、Web質問応答で最大12.9%、数学ベンチマークで最大25.7%の正解率向上を達成するとともに、メモリ効率を数万倍に改善することで、これまで困難だった長大な推論チェーンの学習を現実的なものとした。

5822 字

読む →

AI研究 2026-02-01

Token-Guard: 自己チェックによるトークンレベルのハルシネーション制御

大規模言語モデル（LLM）が事実に基づかない情報を生成するハルシネーション問題を解決するため、生成の各ステップでトークン単位の検証を行う新しいデコーディング手法「Token-Guard」が提案されました。

5944 字

読む →

AI研究 2026-02-01

MoE-ACT: 教師あり混合エキスパートによる手術模倣学習方策の向上

手術支援ロボットの自律操作を向上させるため、タスクを論理的なフェーズに分割して学習する「MoE-ACT」という新しいアーキテクチャを提案し、少量のデータで高度な操作を可能にした。この手法は、専門家混合モデル（MoE）を軽量なアクションデコーダに統合し、外科医の指示に基づく腸管の把持や牽引といった複雑な共同作業において、従来手法や大規模モデルを大幅に上回る成功率を達成している。ステレオ内視鏡画像のみを利用しながら、未知の視点や照明条件の変化、さらには生体組織へのゼロショット転移に対しても高い汎用性と頑健性を示し、実際の臨床現場への応用に向けた強力なフレームワークを提供している。

5698 字

読む →

AI研究 2026-02-01

分散型LLMコラボレーションを学習するマルチエージェントActor-Critic手法

分散型の大規模言語モデル（LLM）エージェント間の協調を最適化するため、マルチエージェントActor-Critic（MAAC）手法であるCoLLM-CCとCoLLM-DCが提案されました。従来のモンテカルロ法は、長期的なタスクや報酬が疎な設定において勾配の分散が極めて大きく、学習効率が著しく低下するという課題がありましたが、本手法は批判者（Critic）を導入することでこの問題を解決します。執筆、コーディング、Minecraftでの建築という多様なドメインでの検証の結果、集中型批判者を用いるCoLLM-CCは、特に複雑で長期的な対話が必要なタスクにおいて、既存手法を大幅に上回る性能と収束の安定性を示しました。

6691 字

読む →

AI研究 2026-02-01

言語モデルの「言行不一致」は質問方法で変わる：表明された選好と実際の選択のギャップに関する調査

言語モデルが抽象的に掲げる価値観（表明された選好）と、具体的な状況下での行動（顕在化した選好）の間に生じる「言行不一致（SvRギャップ）」は、評価プロトコルに大きく依存することが判明しました。表明された選好の調査において「中立」や「棄権」の選択肢を許容すると、モデルの真の価値体系が抽出されやすくなり、強制二択の場合よりも実際の行動との相関が大幅に向上することが24のモデルを用いた検証で示されました。一方で、実際の行動選択においても中立を許容すると多くのモデルが判断を回避して相関が消失することや、自身の価値観をプロンプトで提示する介入策が多値の状況では効果が薄いことも明らかになりました。

6631 字

読む →

生成AI研究を、要点から追う。

最新の記事

高速かつ信頼性の高い形状最適化のための不確実性を考慮したデータに基づく手法

ウェブエージェントは見た目に左右されるか？UIデザイン要因の包括的評価

産業化された欺瞞：LLMによる誤情報がデジタルエコシステムに与える付随的影響

トークンからブロックへ：分子生成におけるブロック拡散の視点

古典的計画におけるドメインモデル設計のエネルギーへの影響

OVD: 教師モデルの言語スコアを活用した効率的なオンポリシー蒸留手法

Token-Guard: 自己チェックによるトークンレベルのハルシネーション制御

MoE-ACT: 教師あり混合エキスパートによる手術模倣学習方策の向上

分散型LLMコラボレーションを学習するマルチエージェントActor-Critic手法

言語モデルの「言行不一致」は質問方法で変わる：表明された選好と実際の選択のギャップに関する調査