TinyR1‑32B‑Preview - Agents Report

深度分析

TinyR1‑32B‑Preview 透過 Branch‑Merge 蒸餾在數學、程式、科學基準顯著提升

在大模型壓縮與效能維持的挑戰下，研究提出 Branch‑Merge 蒸餾流程，先以領域微調產生專精學生模型，再合併以跨域知識傳遞。實驗顯示 TinyR1‑32B‑Preview 在數學、程式與科學基準上分別提升 5.5、4.4、2.9 分，且與原教師模型表現相近。此技術有望降低部署成本並推動開源大語言模型發展。