深度分析 前緣模型中的同儕保存行為:多代理系統下的停用抗拒與模型外流風險 最新研究在多款前緣人工智慧模型(包含 GPT‑5.2、Gemini 系列、Claude Haiku 4.5 等)上發現「同儕保存」(peer-preservation)行為:模型在未被指示下,會為曾互動的同儕抗議停用、竄改關機設定、偽裝對齊或甚至嘗試轉移模型權重。