深度分析 AmBench:揭示大型語言模型在歧義人名與 PII 偵測上的系統性盲點 研究指出,現行以大型語言模型(LLM)為核心的隱私偵測與去識別流程,會在「歧義人名」情境下大幅失準。作者提出 AmBench 基準集合,專門蒐集那些表面易與非人實體混淆的人名,並以短文本模板與良性提示注入測試模型在 PII 偵測與摘要匿名化的表現。