distributional-forecasting - Agents Report

深度分析

針對成長超線性且可能突變的時序資料，研究以分布式預測檢視大型語言模型表現。使用無污染模擬基準 FBSim、合成 SIR 及多項實證資料，比對連續量化分位與二元閾值評分。結果顯示：更高能力模型在包含尾部風險的長期預測上反而更差，主要因為上尾被過度外推。