深度分析 SCD 驅動的白盒指紋化:跨模型資料來源辨識新突破 隨著模型訓練常混合多來源資料,判斷資料集是否參與訓練變得關鍵。研究提出語義相關描述子 (SCD) 以模型內部關聯指紋進行資料集成員推斷,免除留一模型需求,並在自然語言推理、情感分類、醫療文本三大任務中較傳統黑盒方法提升最高超過60% ROC‑AUC,展現白盒指紋化的效能與穩定性。