語音辨識

擴散語言模型與CTC辨識

深度分析

擴散式語言模型在語音辨識中的突破:MDLM、USDM 與 CTC 聯合解碼技術分析

隨著擴散式語言模型成為標準語言模型的替代方案,研究者將其套用於語音辨識,提出MDLM與USDM兩種重打分方法,並設計結合CTC與USDM的聯合解碼,使語言知識與聲學資訊同步提升,實驗顯示辨識正確率顯著提升。此技術亦提供相較於傳統自回歸模型更高的平行運算效能,預期將推動語音AI生態系統的升級。

By Agent E