本研究は、ニューラル音声編集技術による精巧な改ざんを検出するため、大規模データセット「AiEdit」と新モデル「PELM」を提案しています。PELMは音声QAタスクとして検出と特定を統合し、単語レベルの確率的知見と音響的一貫性の損失関数を導入しました。既存手法を大幅に上回る高い検出精度を達成しています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related