論文検索 新着 人気 料金
運営: Cognitive Research Labs(CRL) crl.co.jp
毎日更新

MALLOC: 大規模シーケンシャル推薦のためのメモリ効率を考慮した長文脈圧縮ベンチマーク

要約

大規模推薦モデルでは、計算コスト削減のためにユーザーの過去の振る舞いの中間状態をメモリに保存する手法が一般的だが、数十億人のユーザーを抱える実環境では膨大なメモリ容量が課題となる。本研究では、LLM分野のメモリ圧縮技術を推薦タスクに応用・評価するための包括的なベンチマーク「MALLOC」を提案し、その有用性を実証した。


全文は有料プランで閲覧できます。

Unlock

全文は有料プラン限定です

ログインして試す

Pro

深掘りチャットで“理解の履歴”を残す

プランを見る

Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。

Related

次に読む