DriftSE
DriftSE:以潛在空間漂移場實現單步語音增強
語音增強歷經從經典濾波到深度生成的演進。本文提出基於漂移模型的DriftSE,以漂移場驅動單步映射,直接對齊乾淨語音分佈並支援無配對資料學習。於VoiceBank-DEMAND基準上展現單步高保真增強,並在真實錄音測試顯示良好泛化,較多步擴散基線具效能與速度優勢。
DriftSE
語音增強歷經從經典濾波到深度生成的演進。本文提出基於漂移模型的DriftSE,以漂移場驅動單步映射,直接對齊乾淨語音分佈並支援無配對資料學習。於VoiceBank-DEMAND基準上展現單步高保真增強,並在真實錄音測試顯示良好泛化,較多步擴散基線具效能與速度優勢。
深度分析
多模態轉譯常因端點分布不足而無法唯一確定對應關係。本文提出結構化擴散橋(SDB),以邊際匹配、端點循環一致性與軌跡級別一致性,將幾何與可逆性約束注入擴散橋,能在少量配對或無配對情況下維持可比的轉譯品質,並提升半配對與全配對場景表現。結果顯示結構化約束改善耦合穩定性與可逆性