深度分析 EchoFake:包含物理回放與零樣本 TTS 的語音深偽檢測資料集 語音深偽威脅提升,尤其在電話詐欺與身分冒用場景危害明顯。論文提出EchoFake資料集,結合零樣本TTS與真實物理回放錄音,涵蓋多裝置與環境以模擬實務攻擊。實驗指出現有檢測器在回放情境效能顯著下降,導入回放多樣性訓練可改善跨基準泛化。資料集含超過120小時與逾13000位說話者,基準測試顯示訓練於此可降低平均EER並提升對回放攻擊的穩健性。