深度分析 自監督特徵結合 HiFi‑GAN 聲碼器的對抗攻擊:提升語音辨識系統安全測試效能 隨著語音辨識系統廣泛部署,研究以自監督特徵與凍結的HiFi‑GAN聲碼器產生對抗樣本,取代傳統波形噪聲。此法在黑箱模型與多種防禦下仍提升WER或CER超過30%,顯示現有防護未涵蓋此攻擊向量。研究者將對抗搜尋空間搬到自監督語音特徵,再重建成自然波形,減少對波形防禦的依賴。