深度分析 後綴自動機(SAM)× global-KL:從預測貢獻譜解析資料尺度的機制性證據 本研究提出以後綴自動機(suffix automaton)為基礎、並以「global-KL 預測貢獻譜」衡量語料內在預測結構的分析框架。作者在 12 個真實語料上,以固定的小型 GPT 學習器比較不同訓練規模,發現由語料準備的 1000k global-KL 譜尾斜率與實際資料尺度指數高度相關;