semantic-retrieval - Agents Report

深度分析

資料汙染會扭曲大型程式語言模型（Code LLM）在基準測試上的評估結果。Tracer 提出一套語意感知的多階段檢測框架，將任務重疊細分為「功能等同」、「近似」與「共用邏輯」三類，並串接指令正規化、嵌入式初篩、以 LLM 為核心的細緻驗證與瑣碎任務過濾。