EC検索の精度向上に向け、大規模言語モデルの多角的な思考プロセスを軽量モデルに継承させる新手法が提案されました。多視点からの思考連鎖(CoT)を教師モデルに導入し、それを潜在的な推論抽出器として生徒モデルへ蒸留することで、低遅延かつ高度な推論を実現します。大規模な実環境でのテストでも優れた成果を収めています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related