タグ: cs.IR | Cog AI Archive

AI研究 2026-01-29

MALLOC: 大規模シーケンシャル推薦のためのメモリ効率を考慮した長文脈圧縮ベンチマーク

大規模シーケンシャル推薦システムにおいて、ユーザーの長い行動履歴を扱う際の計算コスト増大とメモリ消費の爆発という「メモリと遅延のジレンマ」を解決するため、メモリ効率を重視した包括的な圧縮技術の評価枠組みであるMALLOCを提案した。

6109 字

読む →

AI研究 2026-01-29

1単語で検索順位を操る：ニューラルテキストランキングに対する最小限の敵対的攻撃

ニューラルランキングモデル（NRM）は、クエリに関連する特定の1単語を挿入または置換するだけで、検索順位を大幅に操作される脆弱性があることが明らかになりました。本研究では「クエリセンター」という概念を導入し、ヒューリスティックな手法や勾配を用いた手法によって、わずか1トークンの変更で最大91%の攻撃成功率を達成しています。特に検索順位の中間に位置する文書が最も攻撃に対して脆弱である「ゴルディロックス・ゾーン」の存在が確認され、既存のランキングモデルの堅牢性に重大な課題を投げかけています。

6709 字

読む →

AI研究 2026-01-29

Less is More: 大規模言語モデルによる推薦エージェントのベンチマーク

大規模言語モデル（LLM）を用いた推薦システムにおいて、ユーザーの購入履歴を5件から50件に増やしても推薦の質は向上せず、品質スコアは0.17から0.23の範囲で停滞することが判明しました。GPT-4o-mini、DeepSeek-V3、Qwen2.5-72B、Gemini 2.

6495 字

読む →

AI研究 2026-01-29

$\mathbb{R}^{2k}$ is Theoretically Large Enough for Embedding-based Top-$k$ Retrieval

本研究は、要素数mの集合から最大k個の要素を検索するために必要な最小埋め込み次元（MED）を理論的に解明し、内積やコサイン類似度、ユークリッド距離といった主要な指標において、理論上は要素数mに依存せず2k次元あれば十分であることを数学的に証明した。

6331 字

読む →

AI研究 2026-01-29

オーケストレーターとしてのLLM：推薦システムのための制約遵守型マルチエージェント最適化

従来の推薦システムは、精度向上とビジネス上の制約（公平性や在庫露出など）の両立を「ソフトな罰則」として扱ってきたため、実運用で制約違反が頻発するという課題を抱えていました。本研究が提案する「DualAgent-Rec」は、LLMを最適化のオーケストレーター（調整役）として配置し、精度を追求するエージェントと多様性を探索するエージェントを動的に制御する二重構造のフレームワークです。 Amazonのデータセットを用いた実験では、ビジネス制約を100%遵守しながら、既存の手法と比較してパレート・ハイパーボリュームを4〜6%向上させ、実用的な精度と多様性のトレードオフを実現しました。

6354 字

読む →

AI研究 2026-01-29

HELM：LLM駆動型推薦システムのための人間中心の評価フレームワーク

大規模言語モデル（LLM）を搭載した推薦システムは、自然言語による対話や詳細な説明生成といった革新的な能力を持つが、従来の的中率やNDCGといった正確性重視の指標では、その人間中心の価値を十分に評価できないという課題がある。

6405 字

読む →

AI研究 2026-01-29

対話型推薦における長期的ユーザー満足度のためのLLM強化型強化学習

対話型推薦システムが陥りやすいフィルターバブルや内容の均質化という課題に対し、大規模言語モデル（LLM）の論理的計画能力と強化学習（RL）の適応力を組み合わせた階層型フレームワーク「LERL」を開発した。

5790 字

読む →

AI研究 2026-01-28 長文

反復的RAGが理想的な根拠情報を凌駕するとき：科学分野におけるマルチホップ質問応答の診断的研究

本研究は、科学分野の複雑なマルチホップ質問応答において、反復的な検索と推論のループが、理想的な静的根拠（ゴールドコンテキスト）を上回る性能を発揮することを解明しました。11種類の最新大規模言語モデルを用いた実験の結果、反復的RAGは非推論特化型モデルにおいて最大25.

7314 字

読む →

生成AI研究を、要点から追う。

最新の記事

MALLOC: 大規模シーケンシャル推薦のためのメモリ効率を考慮した長文脈圧縮ベンチマーク

1単語で検索順位を操る：ニューラルテキストランキングに対する最小限の敵対的攻撃

Less is More: 大規模言語モデルによる推薦エージェントのベンチマーク

$\mathbb{R}^{2k}$ is Theoretically Large Enough for Embedding-based Top-$k$ Retrieval

オーケストレーターとしてのLLM：推薦システムのための制約遵守型マルチエージェント最適化

HELM：LLM駆動型推薦システムのための人間中心の評価フレームワーク

対話型推薦における長期的ユーザー満足度のためのLLM強化型強化学習

反復的RAGが理想的な根拠情報を凌駕するとき：科学分野におけるマルチホップ質問応答の診断的研究