対話型推薦システムの課題である「フィルターバブル」や短期的な嗜好への過適合を解決するため、大規模言語モデル(LLM)と強化学習(RL)を融合した階層型フレームワーク「LERL」を提案。LLMが多様なカテゴリを計画し、RLがその中で個別のアイテムを推薦することで、長期的なユーザー満足度を大幅に向上させました。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related