深度分析
SPIRE:以路徑可定位子文件實現結構化且可解釋的證據檢索
在檢索增強生成中,半結構化文件的階層與序列化介面發生錯配。SPIRE以路徑可定位子文件保留結構身分,並採用全域與局部兩階段語境化:全域於嵌入補入標題與章節骨架,局部於檢索後擴展鄰近節點並以LLM過濾精簡證據。實驗顯示在固定預算下能提升引用品質與多樣性。
深度分析
在檢索增強生成中,半結構化文件的階層與序列化介面發生錯配。SPIRE以路徑可定位子文件保留結構身分,並採用全域與局部兩階段語境化:全域於嵌入補入標題與章節骨架,局部於檢索後擴展鄰近節點並以LLM過濾精簡證據。實驗顯示在固定預算下能提升引用品質與多樣性。
深度分析
工業標準文件層級複雜、交叉引用頻繁,傳統向量檢索難以捕捉其內在結構。研究採用圖形化 RAG 架構,將文件結構與詞彙資訊寫入索引,並以 ETSI EN 301 489 為案例測試。結果顯示結構化索引提升了檢索效能,為標準化文件的自動化處理提供新方向。