音声フィンガープリンティングにおける入力音声のセグメント長が検索性能に与える影響を調査した研究。既存のニューラルアーキテクチャを拡張し多様な長さで評価した結果、0.5秒という短いセグメント長が一般的に優れた性能を示すことが判明した。また、LLMによる最適な長さの推奨能力も評価され、GPT-5-miniが最も優れた提案を行った。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related