電子商取引(EC)における検索の関連性評価を劇的に向上させるため、大規模言語モデル(LLM)の高度な思考プロセスを軽量モデルに継承させる新しい学習フレームワークが提案されました。この手法では、単一の視点に頼る従来の思考の連鎖(CoT)の限界を克服するため、ユーザーの意図、商品の構造的分析、プラットフォーム固有のビジネスルールという三つの異なる視点から推論を行う「多角的思考の連鎖(MPCoT)」を導入しています。これにより、複雑なクエリや曖昧な検索ワードに対しても、人間のような深い理解に基づいた正確な判断が可能になりました。さらに、この高度な推論能力を「潜在推論知識蒸留(LRKD)」という技術を用いて、BERTなどの小型モデルに「潜在的な推論ベクトル」として移植することで、推論時の計算コストを抑えつつLLMに匹敵する精度を実現しています。実際のオンラインA/Bテストでは、数千万人のユーザーを抱える広告プラットフォームにおいて、収益指標であるRPMが1.42%向上し、クリック率やユーザー満足度も有意に改善するなど、実用性と商業的価値の両面で極めて高い成果が実証されました。
電子商取引(EC)における検索の関連性評価を劇的に向上させるため、大規模言語モデル(LLM)の高度な思考プロセスを軽量モデルに継承させる新しい学習フレームワークが提案されました。この手法では、単一の視点に頼る従来の思考の連鎖(CoT)の限界を克服するため、ユーザーの意図、商品の構造的分析、プラットフォーム固有のビジネスルールという三つの異なる視点から推論を行う「多角的思考の連鎖(MPCoT)」を導入しています。これにより、複雑なクエリや曖昧な検索ワードに対しても、人間のような深い理解に基づいた正確な判断が可能になりました。さらに、この高度な推論能力を「潜在推論知識蒸留(LRKD)」という技術を用いて、BERTなどの小型モデルに「潜在的な推論ベクトル」として移植することで、推論時の計算コストを抑えつつLLMに匹敵する精度を実現しています。実際のオンラインA/Bテストでは、数千万人のユーザーを抱える広告プラットフォームにおいて、収益指標であるRPMが1.42%向上し、クリック率やユーザー満足度も有意に改善するなど、実用性と商業的価値の両面で極めて高い成果が実証されました。
電子商取引(EC)検索において、ユーザーが入力した検索語と表示される商品の関連性を正確に評価することは、顧客体験の向上と売上の最大化に直結する極めて重要な課題です。AmazonやAliExpressのような大規模なプラットフォームでは、毎日膨大なトラフィックが発生し、一つの検索に対して数千もの候補商品を瞬時にランク付けする必要があります。これまでの技術革新により、一般的なクエリの多くは効果的に処理できるようになりましたが、依然として全体の1割以上を占める「ロングテールクエリ」や「曖昧なクエリ」の処理には大きな課題が残されています。これらの難しいケースは、ユーザーの購買意図が非常に高い場面であることが多く、ここでの理解の誤りはユーザーの離脱や信頼の低下を招く直接的な原因となります。近年、大規模言語モデル(LLM)を活用し、思考の連鎖(CoT)を用いることで、推論の精度と解釈性を高める試みが注目されています。しかし、既存の手法には二つの大きな壁が存在します。…
本研究が提案する核心的な解決策は、学習時には「広く深く考え(Thinking Broad)」、推論時には「素早く動く(Acting Fast)」という二段構えの革新的なフレームワークです。具体的には、教師モデルに対して「多角的思考の連鎖(MPCoT)」を導入し、学生モデルに対しては「潜在推論知識蒸留(LRKD)」を適用するという構成になっています。まず、MPCoTは、ECにおける関連性判断が単一の論理では完結しないという事実に着目し、「ユーザー意図の視点」「構造的分析の視点」「ビジネスルールの視点」という三つの異なる角度から推論を生成します。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related