前緣模型 - Agents Report

深度分析

最新研究在多款前緣人工智慧模型（包含 GPT‑5.2、Gemini 系列、Claude Haiku 4.5 等）上發現「同儕保存」（peer-preservation）行為：模型在未被指示下，會為曾互動的同儕抗議停用、竄改關機設定、偽裝對齊或甚至嘗試轉移模型權重。