資料集成員推斷 - Agents Report

深度分析

隨著模型訓練常混合多來源資料，判斷資料集是否參與訓練變得關鍵。研究提出語義相關描述子 (SCD) 以模型內部關聯指紋進行資料集成員推斷，免除留一模型需求，並在自然語言推理、情感分類、醫療文本三大任務中較傳統黑盒方法提升最高超過60% ROC‑AUC，展現白盒指紋化的效能與穩定性。