深度分析 IBM Granite Speech 4.1:2B 自回歸與 2B‑NAR 非自回歸架構兼顧辨識準確度與低延遲 IBM發表GraniteSpeech4.1系列,對企業語音辨識提出低延遲與成本可控的路線。利用16層Conformer加雙頭CTC與窗口Q‑Former,分自回歸與非自回歸兩種推理策略;結果在公開榜單達到具競爭力的WER並以NAR取極速推理。