深度分析 Tracer:以嵌入檢索與 LLM 驗證進行 Code LLM 資料汙染語意分級 資料汙染會扭曲大型程式語言模型(Code LLM)在基準測試上的評估結果。Tracer 提出一套語意感知的多階段檢測框架,將任務重疊細分為「功能等同」、「近似」與「共用邏輯」三類,並串接指令正規化、嵌入式初篩、以 LLM 為核心的細緻驗證與瑣碎任務過濾。