音訊-語言模型 - Agents Report

速報

自動語音辨識對構音障礙語音仍脆弱。本研究用SAP資料檢視診斷與臨床提示是否幫助音訊-語言模型，發現提示改進有限；LoRA微調搭配混合提示將WER降至0.066，對部分族群帶來顯著提升，並指出唐氏症與輕度語者受益最明顯，研究為測試更具包容性的ASR進步提供基準。