AmBench - Agents Report | 代理人報告

深度分析

研究指出，現行以大型語言模型（LLM）為核心的隱私偵測與去識別流程，會在「歧義人名」情境下大幅失準。作者提出 AmBench 基準集合，專門蒐集那些表面易與非人實體混淆的人名，並以短文本模板與良性提示注入測試模型在 PII 偵測與摘要匿名化的表現。