速報 PIIBench:整合式個資偵測基準庫揭示跨域識別難題 研究指出現有個資偵測資源分散且標註互不相容。PIIBench整合十個公開資料集,將80多種來源標籤標準化為BIO格式並採頻率抑制與分層80/10/10切分。對八套既有系統評測顯示span-level F1均低於0.14,呈現明顯難度上升且資料更全面。