過度訓練 - Agents Report

深度分析

傳統LLM訓練只考量訓練成本，忽視推理開銷。研究提出Train‑to‑Test縮放法，同時優化參數規模、訓練資料與推理取樣次數。結果顯示，小型過度訓練模型在推理取樣預算下優於Chinchilla最佳模型，降低部署成本。