深度分析 任意停時有效推論與保守參考池:為黑盒產生—驗證工作流程建立可證明的釋出控制 大型語言模型工作流程採反覆產生─評估─修正,停下釋出何時為難題。本文以離線高分失敗樣本建參考池,將黑盒驗證分數校準成步進 p 值,並以 e-process 在任意停時下累積證據判決釋出;結果顯示可抑制不可行任務的過早釋出風險,同時保留對可行任務的釋出能力。