深度分析 Toto 2.0 時間序列預測模型:4M‑2.5B 參數規模化與 CPM、分位數頭、NorMuon 改進 研究指出時間序列基礎模型採用單一擴散配方,從4M到2.5B參數皆能提升預測品質;Toto 2.0以連續區塊遮蔽與分位數輸出頭取代自迴歸,於BOOM、GIFT‑Eval、TIME三大基準創下新紀錄,證明模型放大即帶來效能突破,並為未來多模態預測鋪路。