AI研究 2026-02-01 タグ: cs.IR, cs.AI, cs.LG, cs.MA

オーケストレーターとしてのLLM：推薦システムのための制約遵守型マルチエージェント最適化

DualAgent-Recは、LLMを高度なオーケストレーターとして活用し、推薦精度と多様性の最適化、および公平性や出品者カバレッジといった厳しいビジネス制約の完全な遵守を両立させる新しいマルチエージェント・フレームワークです。

論文図解

TL;DR（結論）

DualAgent-Recは、LLMを高度なオーケストレーターとして活用し、推薦精度と多様性の最適化、および公平性や出品者カバレッジといった厳しいビジネス制約の完全な遵守を両立させる新しいマルチエージェント・フレームワークです。このシステムは、制約下で精度を磨く「活用エージェント」と広範なトレードオフを探索する「探索エージェント」を分離し、LLMが最適化の進捗に応じて両者のリソース配分を動的に調整することで、手動ルールに頼らない適応的な制御を実現します。 Amazon Reviews 2023データセットを用いた検証では、既存手法を上回るパレート性能を記録しながら、すべてのテストケースで100%の制約遵守率を達成しており、LLMが複雑な最適化の司令塔として極めて有効であることを示しました。

なぜこの問題か

現代の電子商取引（Eコマース）における推薦システムは、単にユーザーの好みに合った商品を提示するだけでなく、プラットフォーム全体の健全性を維持するために極めて複雑な役割を担っています。具体的には、推薦の精度を最大化する一方で、カタログの多様性を確保し、特定の出品者に偏らない公平性を維持し、さらに新商品の露出を促進するといった、互いに相反する可能性のある複数の目的を同時に最適化する必要があります。これらの目的はビジネス上の要件として非常に重要であり、特に公平性やカバレッジ、露出に関するルールは、実際の運用環境において一度の違反も許されない「ハードな制約」として機能することが求められます。しかしながら、これまでの多目的推薦システムに関する研究の多くは、これらのビジネス制約を目的関数の一部として組み込むか、あるいは違反に対して罰則を与える「ソフトなペナルティ」として処理する手法が主流でした。このようなアプローチでは、最適化の過程で制約が軽視される傾向があり、実際の運用環境においては頻繁に制約違反が発生し、出品者間の露出の不均衡やビジネスルールの逸脱を招くという深刻な問題が指摘されています。…

核心：何を提案したのか

本研究が提案する「DualAgent-Rec」は、LLMをオーケストレーター（調整役）として配置した、制約遵守型のマルチエージェント最適化フレームワークです。このフレームワークの最大の特徴は、推薦タスクにおける最適化プロセスを「活用（Exploitation）」と「探索（Exploration）」という二つの専門的な役割を持つエージェントに分離し、それらをLLMが高度な視点から統合・制御する点にあります。従来のシステムが制約を後付けのフィルターや弱い罰則として扱っていたのに対し、DualAgent-Recは制約遵守を設計段階からの第一級オブジェクトとして扱い、デプロイされるすべての推薦リストがビジネスルールを完全に満たすことを保証します。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。