深度分析 多金鑰水印在生成式模型中的監測與歸因風險 研究提出把水印視為一項監測原語,而非僅是單筆偵測或防偽工具。作者以觀察者(observer)威脅模型區分內部觀察者(有金鑰)與外部觀察者(無金鑰),指出即便是零位元水印,在多金鑰部署下也會產生持久的、可被聚合的統計結構,進而支持實體層級的歸因與連結。
深度分析 自適應盜取技術提升大型語言模型水印破解效率 大型語言模型的水印防護因盜取攻擊而受威脅。研究提出自適應盜取(AS)演算法,利用位置建構與動態選擇模組,從多重激活視角挑選最佳攻擊路徑。實驗證明 AS 能在相同條件下大幅提升盜取效率,顯示現有水印需更強韌。