深度分析 以馬可夫模型與學習式 CUSUM 快速偵測語言模型幻覺起始 本研究將幻覺起始視為快速變化偵測,使用第一階馬可夫模型推導出在1%誤報率下理論最小延遲約1.3 token,並比較多種檢測器,發現學習式CUSUM在11至13 token內偵測,遠快於高斯CUSUM的41 token與線性模型的31 token,指出資訊率瓶頸是主要限制,未來提升特徵可望縮短延遲。