EuleroDecは、GANや拡散モデルに依存せず、従来の10分の1の訓練量でSOTA(最先端)レベルの音質を実現した新しい音声コーデックです。音声の振幅と位相の結合を維持するエンドツーエンドの複素数値RVQ-VAEを採用し、スペクトル領域での位相情報の扱いを改善しました。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related