タグ: AI | Cog AI Archive

AI研究 2026-02-01

Magellan：AlphaEvolveを用いた新規コンパイラ最適化ヒューリスティクスの自律的発見

現代のコンパイラが依存する手動設計のヒューリスティクスは、複雑なソフトウェアや多様なハードウェアへの適応が困難で保守負担も大きいという課題がありますが、本研究ではLLMと進化探索、自動チューニングを組み合わせたエージェント型フレームワーク「Magellan」を提案し、実行可能なC++の決定ロジックを直接合成することでこの問題を解決します。 LLVMの関数インライニングにおいて、Magellanは数十年にわたる専門家の手動設計を上回る新しいヒューリスティクスを合成し、バイナリサイズの削減率で5.23%の向上を達成したほか、生成されたコードは手動実装の約15分の1という極めて簡潔な記述でありながら、既存のコンパイラに直接統合して運用できる高い実用性を備えていることが確認されました。この手法はレジスタ割り当てやXLAなどの異なる最適化タスクやコンパイラ基盤にも適用可能であり、特定のベンチマークへの過学習を避けつつ、時間の経過や異なるアプリケーション領域に対しても高い汎用性を示すことが実証されており、ニューラルネットワークを直接コンパイラに組み込む手法に代わる、保守性と性能を両立した新しい自動設計の道を切り拓いています。

6353 字

読む →

AI研究 2026-02-01

SteerEval: 自然言語プロファイルを用いた推薦システムの操作性評価フレームワーク

自然言語プロファイルを用いた推薦システムは、ユーザーが自分の好みをテキストで直接編集できるため、従来の数値ベクトル形式よりも高い透明性と操作性を提供しますが、これまでの評価は映画のジャンルなどの限定的な属性に留まっており、多様な要求への対応力は不明でした。

5730 字

読む →

AI研究 2026-02-01 長文

情報アクセスがLLMモニターのサボタージュ検出能力に与える影響

LLMエージェントの不正（サボタージュ）を検知する際、思考プロセス（CoT）と行動ログの全情報を与えるよりも、あえて情報を制限した方が検知精度が高まる「Less-is-more」効果が複数の環境で確認されました。

7262 字

読む →

AI研究 2026-02-01

マルチタスク・コードLLM：データミックスか、モデルマージか？

本研究では、コード生成とコード要約という二つの主要なタスクを同時にこなす小規模なコードLLMを構築する際、学習データを混ぜて一度に微調整する「データ混合」と、個別に学習した専門モデルを統合する「モデルマージ」のどちらが有効かを、Qwen CoderやDeepSeek Coderを用いて詳細に調査した。実験の結果、1.

6109 字

読む →

AI研究 2026-02-01

マルチタスク・コードLLM：データの混合か、モデルの統合か？

本研究は、小規模なコード特化型LLM（Qwen2.5-CoderおよびDeepSeek-Coder）において、複数のタスクを効率的に習得させるための最適な学習戦略を、1.5Bから7Bのモデル規模で比較検証しました。検証の結果、1.

6550 字

読む →

AI研究 2026-02-01

マルチタスク・コードLLM：データミックスか、モデルマージか？

本研究では、小規模なコード特化型LLMをマルチタスク化する際、学習データを混ぜて微調整する「データ混合」と、個別に学習したモデルを統合する「モデルマージ」のどちらが有効かを体系的に調査しました。Qwen2.

6116 字

読む →

AI研究 2026-02-01

CUA-Skill：コンピュータを使用するエージェントのためのスキル開発

CUA-Skillは、人間がコンピュータを操作する際の知識を、再利用可能な「スキル」として構造化した大規模なライブラリであり、Windows上の多様なアプリケーションに対応するパラメータ化された実行グラフと構成グラフを備えている。

6368 字

読む →

AI研究 2026-02-01

CUA-Skill: コンピュータを使用するエージェントのためのスキル開発

CUA-Skillは、人間がコンピュータを操作する際の手続き的知識を、再利用可能で構造化された「スキル」として体系化した大規模なライブラリであり、Windows上の多様なアプリケーションに対応する操作をパラメータ化された実行グラフと構成グラフによって定義しています。

6707 字

読む →

AI研究 2026-02-01

CUA-Skill：コンピュータ利用エージェントのためのスキル開発

CUA-Skillは、人間のコンピュータ操作知識を「実行グラフ」と「構成グラフ」を備えた再利用可能なスキルとして体系化した大規模なライブラリであり、複雑なデスクトップ作業を構造化された中間層として定義することで、エージェントの操作を効率化します。

6269 字

読む →

AI研究 2026-02-01

PhaseCoder：マルチモーダルLLMのためのマイク配置に依存しない空間オーディオ理解

PhaseCoderは、マイクの個数や配置といった幾何学的な条件に依存することなく、多チャンネルの音声データから豊かな空間情報を抽出することが可能な、トランスフォーマーのみで構成された画期的な空間オーディオエンコーダである。

6125 字

読む →

生成AI研究を、要点から追う。

最新の記事

Magellan：AlphaEvolveを用いた新規コンパイラ最適化ヒューリスティクスの自律的発見

SteerEval: 自然言語プロファイルを用いた推薦システムの操作性評価フレームワーク

情報アクセスがLLMモニターのサボタージュ検出能力に与える影響

マルチタスク・コードLLM：データミックスか、モデルマージか？

マルチタスク・コードLLM：データの混合か、モデルの統合か？

マルチタスク・コードLLM：データミックスか、モデルマージか？

CUA-Skill：コンピュータを使用するエージェントのためのスキル開発

CUA-Skill: コンピュータを使用するエージェントのためのスキル開発

CUA-Skill：コンピュータ利用エージェントのためのスキル開発

PhaseCoder：マルチモーダルLLMのためのマイク配置に依存しない空間オーディオ理解