速報 模型規範中期訓練(MSM):用規範文件引導模型泛化 前沿人工智慧團隊以「模型規範」設定語言模型期望行為。本研究提出模型規範中期訓練(MSM):在預訓練後、微調前以合成文件教授規範內容,塑造模型從示範資料的泛化方向。應用於自我保存與目標護衛規範時,Qwen3-32B的代理性錯誤率由54%降至7%,優於一項推理式基準14%。