深度分析 端到端評估 FATHOMS-RAG:跨文檔與多模態 RAG 的幻覺偵測與 OCR 整合 研究指出,檢索增強生成(RAG)可減少大型語言模型的幻覺,針對多模態科學文件的端到端評估仍短缺。本文提出FATHOMS-RAG,結合短語召回與最近鄰嵌入分類器以區分放棄與幻覺,並發現封閉源系統在正確性與幻覺避免上顯著領先。該基準含93題、涵蓋表格、圖像與跨文檔問題,並由人類評估驗證指標效度。