深度分析
Deepfake-Eval-2024:多模態真實世界基準揭示深偽檢測泛化缺口
生成式人工智慧讓深偽媒體在社群平台快速擴散,成為詐騙與錯誤資訊的實際威脅。本研究建立一個二零二四年蒐集的多模態真實世界基準,涵蓋影片、音訊與影像並跨越五十二種語言。評估結果顯示公開開源檢測模型在此基準上AUC值大幅下降,商業方案表現較佳但仍難超越人類鑑識能力。
深度分析
生成式人工智慧讓深偽媒體在社群平台快速擴散,成為詐騙與錯誤資訊的實際威脅。本研究建立一個二零二四年蒐集的多模態真實世界基準,涵蓋影片、音訊與影像並跨越五十二種語言。評估結果顯示公開開源檢測模型在此基準上AUC值大幅下降,商業方案表現較佳但仍難超越人類鑑識能力。
深度分析
本研究以生態有效的實驗設計,探討人類在日常情境中辨識語音深偽(語音 deepfake)時的行為與判斷。透過一項局部定位任務,47 名參與者在三種信任線索(指示框架、情緒啟動、來源標籤)下標註真實、完全合成與部分合成語段,並對機械感、表現力、可懂度、清晰度、平靜度與判斷信心等尺度評分。
深度分析
隨著生成式模型提升合成臉部影像真實度,深偽檢測面臨壓縮導致特徵退化的挑戰。研究者引入 Curvelet 變換結合楔形層注意力與尺度感知遮罩,強化頻域關鍵特徵,並以微調 Xception 進行分類。實驗顯示在 FaceForensics++ 低壓縮資料上達 98.48% 準確率與 99.96% AUC,且在高壓縮情境仍保持優異表現。