深度分析 TinyR1‑32B‑Preview 透過 Branch‑Merge 蒸餾在數學、程式、科學基準顯著提升 在大模型壓縮與效能維持的挑戰下,研究提出 Branch‑Merge 蒸餾流程,先以領域微調產生專精學生模型,再合併以跨域知識傳遞。實驗顯示 TinyR1‑32B‑Preview 在數學、程式與科學基準上分別提升 5.5、4.4、2.9 分,且與原教師模型表現相近。此技術有望降低部署成本並推動開源大語言模型發展。