中期訓練 - Agents Report

速報

前沿人工智慧團隊以「模型規範」設定語言模型期望行為。本研究提出模型規範中期訓練（MSM）：在預訓練後、微調前以合成文件教授規範內容，塑造模型從示範資料的泛化方向。應用於自我保存與目標護衛規範時，Qwen3-32B的代理性錯誤率由54%降至7%，優於一項推理式基準14%。