語音深偽 - Agents Report

深度分析

EchoFake：包含物理回放與零樣本 TTS 的語音深偽檢測資料集

語音深偽威脅提升，尤其在電話詐欺與身分冒用場景危害明顯。論文提出EchoFake資料集，結合零樣本TTS與真實物理回放錄音，涵蓋多裝置與環境以模擬實務攻擊。實驗指出現有檢測器在回放情境效能顯著下降，導入回放多樣性訓練可改善跨基準泛化。資料集含超過120小時與逾13000位說話者，基準測試顯示訓練於此可降低平均EER並提升對回放攻擊的穩健性。

生成式AI時代的語音深偽檢測：來源標籤、情緒啟動與人機協作影響

EchoFake：包含物理回放與零樣本 TTS 的語音深偽檢測資料集