AI研究 2026-01-24 タグ: cs.IR, cs.CL

大文字か小文字か：学習済みスパース検索における実証的研究

要約

学習済みスパース検索（LSR）において、バックボーンモデルの大文字・小文字の区別が性能に与える影響を調査した研究です。区別あり（cased）モデルは、デフォルトでは区別なし（uncased）モデルより性能が大幅に劣りますが、テキストを小文字化する前処理でその差を解消できることが示されました。

全文は有料プランで閲覧できます。

Unlock

ログインして試す

Pro

プランを見る

Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。