深度分析
生成式AI時代的語音深偽檢測:來源標籤、情緒啟動與人機協作影響
本研究以生態有效的實驗設計,探討人類在日常情境中辨識語音深偽(語音 deepfake)時的行為與判斷。透過一項局部定位任務,47 名參與者在三種信任線索(指示框架、情緒啟動、來源標籤)下標註真實、完全合成與部分合成語段,並對機械感、表現力、可懂度、清晰度、平靜度與判斷信心等尺度評分。
深度分析
本研究以生態有效的實驗設計,探討人類在日常情境中辨識語音深偽(語音 deepfake)時的行為與判斷。透過一項局部定位任務,47 名參與者在三種信任線索(指示框架、情緒啟動、來源標籤)下標註真實、完全合成與部分合成語段,並對機械感、表現力、可懂度、清晰度、平靜度與判斷信心等尺度評分。
深度分析
語音深偽威脅提升,尤其在電話詐欺與身分冒用場景危害明顯。論文提出EchoFake資料集,結合零樣本TTS與真實物理回放錄音,涵蓋多裝置與環境以模擬實務攻擊。實驗指出現有檢測器在回放情境效能顯著下降,導入回放多樣性訓練可改善跨基準泛化。資料集含超過120小時與逾13000位說話者,基準測試顯示訓練於此可降低平均EER並提升對回放攻擊的穩健性。