学習済みスパース検索(LSR)において、バックボーンモデルの大文字・小文字の区別が性能に与える影響を調査した研究です。区別あり(cased)モデルは、デフォルトでは区別なし(uncased)モデルより性能が大幅に劣りますが、テキストを小文字化する前処理でその差を解消できることが示されました。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related