深度分析 LLM 在尾部風險預測的反向尺度:CRPS 顯示能力提升卻導致上尾錯配 針對成長超線性且可能突變的時序資料,研究以分布式預測檢視大型語言模型表現。使用無污染模擬基準 FBSim、合成 SIR 及多項實證資料,比對連續量化分位與二元閾值評分。結果顯示:更高能力模型在包含尾部風險的長期預測上反而更差,主要因為上尾被過度外推。