従来の推薦システムは、精度向上とビジネス上の制約(公平性や在庫露出など)の両立を「ソフトな罰則」として扱ってきたため、実運用で制約違反が頻発するという課題を抱えていました。 本研究が提案する「DualAgent-Rec」は、LLMを最適化のオーケストレーター(調整役)として配置し、精度を追求するエージェントと多様性を探索するエージェントを動的に制御する二重構造のフレームワークです。 Amazonのデータセットを用いた実験では、ビジネス制約を100%遵守しながら、既存の手法と比較してパレート・ハイパーボリュームを4〜6%向上させ、実用的な精度と多様性のトレードオフを実現しました。
従来の推薦システムは、精度向上とビジネス上の制約(公平性や在庫露出など)の両立を「ソフトな罰則」として扱ってきたため、実運用で制約違反が頻発するという課題を抱えていました。 本研究が提案する「DualAgent-Rec」は、LLMを最適化のオーケストレーター(調整役)として配置し、精度を追求するエージェントと多様性を探索するエージェントを動的に制御する二重構造のフレームワークです。 Amazonのデータセットを用いた実験では、ビジネス制約を100%遵守しながら、既存の手法と比較してパレート・ハイパーボリュームを4〜6%向上させ、実用的な精度と多様性のトレードオフを実現しました。
現代の電子商取引(eコマース)プラットフォームにおける推薦システムは、単にユーザーの好みに合わせるだけでなく、非常に複雑で相反する複数の目標を同時に達成することが求められています。具体的には、推薦の正確性だけでなく、カタログ全体の多様性、出品者間の公平性、そして新製品の露出機会の確保といった要素が挙げられます。これらの要素はプラットフォームの長期的な健全性を維持するために不可欠ですが、これまでの研究の多くは、これらのビジネス要件を「ソフトなペナルティ」として数式に組み込むにとどまっていました。その結果、実際の運用環境においては、一度の違反も許されないような厳格なビジネス制約が守られず、特定の出品者に露出が偏ったり、新しい商品が全く表示されなかったりするという問題が継続的に発生していました。 また、近年の多目的最適化技術の進展により、精度と多様性のトレードオフを明示的にモデル化するパレート最適化手法が登場していますが、これらも制約条件を単なる追加の目的関数として扱う傾向があります。…
本研究は、LLMを最適化の調整役として活用する二重エージェント・フレームワーク「DualAgent-Rec」を提案しました。このフレームワークの最大の特徴は、推薦タスクを「活用(Exploitation)」と「探索(Exploration)」という二つの専門的な役割に分離し、それらをLLMが動的に統制する点にあります。具体的には、厳格なビジネス制約を遵守しながら精度の高い解を洗練させる「活用エージェント」と、制約を一時的に無視して目的関数空間の未知の領域を広く探索する「探索エージェント」を並行して走らせます。これにより、制約を満たすことだけに固執して局所解に陥るのを防ぎつつ、最終的には必ず制約を満たす高品質な推薦リストを生成することが可能になります。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related