深度分析 WorldSpeech:65,000 小時、覆蓋 76 種語言的多語言對齊語料庫與迭代式 ASR 對齊策略 研究指出多語言ASR在低資源語言因配對音檔與逐字稿不足而表現受限。WorldSpeech從議會記錄、國家與國際廣播及公域有聲書匯整並標準化資料,採用自動對齊流程,對首輪配對結果微調ASR再重對齊以回收更多對齊時數。實驗顯示微調後WER大幅下降,提升低資源語言訓練資料可用性。