深度分析 ReFEree:無參考與細粒度的程式碼說明事實一致性評估方法 隨著大型語言模型能產生長篇程式碼說明,評估事實一致性變得關鍵。ReFEree 提出無參考、段落細粒度評估,結合依賴資訊。實驗證明其與人工判斷相關性最高,提升約 15%至 18%。