深度分析 SCRIBE:為印度語系設計的 sandhi 容忍豐富轉錄與多維診斷框架 語音辨識在專業逐字錄入需超過校正門檻,本研究提出SCRIBE:以sandhi容忍對齊、類別化錯誤分解、領域詞庫注入與LLM整理管線,將詞彙、標點、數字與領域實體分開度量,實驗顯示其分類指標與專家判定高度一致,並能導向精準修正與資料整理策略,恢復語言評估公正。