本研究は、高度なニューラル音声編集による改ざんを検出すべく、大規模データセット「AiEdit」と新モデル「PELM」を提案しています。PELMはオーディオLLMを基盤とし、単語レベルの確率分布や音響的一貫性の損失関数を導入することで、検出と特定を統合しました。既存手法を大幅に上回る高い精度を達成しています。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related