深度分析 小片段程式碼 ↔ 文本檢索突破:CodeBERT/GraphCodeBERT 與 FAISS 結合的 CAT 方法 語言模型同時處理程式碼與文字的需求提升,研究者提出雙向小粒度搜尋任務,打造包含三十萬對自動生成說明的資料集,並設計 CAT 模型共用編碼器預測答案起止。實驗在同領域測試中 F1 超過八成,顯示此技術可加速科研程式碼與說明的對應,並支援即時向量檢索。