深度分析 憲法式在策略安全蒸餾(COPSD)提升安全指標與生成多樣性 本研究聚焦於安全對齊的在策略自蒸餾,提出憲法式在策略安全蒸餾(COPSD)兩階段框架,先以交叉SFT冷啟動校正教師,再以憲法條件進行密集監督。實驗顯示COPSD在12項基準上同時提升安全與效能,超越既有方法。此框架亦與KD‑MARL的知識蒸餾策略作比較,顯示在資源受限設備上仍具可部署性。