聴覚LLMは多くの音声タスクで高性能ですが、データ不足や未知のタスクには苦戦します。本研究は、少数の実例を提示して推論させる「文脈内学習(ICL)」の有効性を確認し、高リソース音声データのみを用いてICL能力を強化する学習手法「SICL-AT」を提案しました。低リソース環境下で直接微調整するよりも高い性能を示しています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related