託管 LLM 偵測 - Agents Report

深度分析

託管LLM常被以低成本模型替代；論文提出以Merkle承諾的commit-open協議，事先提交SAE每位置信息，再隨機開放抽檢並以joint-z分數判定，能辨識跨家族與LoRA自適應替代，且在測試中對多數攻擊者均生效。承諾開放可閉合SVIP的平行提供漏洞，額外開銷小於特定批次延時上限。