Ψ-RAG:以分層抽象樹解決跨文件多跳檢索生成
背景:RAG以外部知識強化大型語言模型,樹狀RAG難擴展到跨文件多跳。Ψ-RAG透過迭代「合併與收縮」建分層抽象樹,並由多粒度檢索代理與混合檢索器互動查詢。在跨文件多跳QA上,平均F1領先RAPTOR25.9%與HippoRAG2 7.4%。
重點速覽
Ψ-RAG提出針對跨文件多跳問題的樹狀檢索生成方案,主攻現行樹狀RAG在跨文檔應用的三大侷限:分布假設、結構孤立與抽象粗糙。
方法概述
第一個核心是分層抽象樹索引,透過迭代「合併與收縮」程序建構索引結構,該流程不依賴事前的分布假設,能自適應文件集合的實際分佈並逐步抽象信息。
第二個核心是多粒度檢索代理。該代理會根據任務需求改寫查詢,並與一個代理驅動的混合檢索器互動,實現跨粒度、跨文件的知識檢索與聚合。
應用與成效
Ψ-RAG支持從詞元級問答到文件級摘要等多樣任務。在跨文件多跳問答基準上,Ψ-RAG的平均F1分數較RAPTOR高出25.9%,較HippoRAG2高出7.4%,顯示在多跳跨文檔推理場景具備顯著優勢。
原始實作與程式碼可於GitHub取得:https://github.com/Newiz430/Psi-RAG
延伸閱讀
- Intuit TurboTax 實作案例:利用 LLM 與 DSL 將 900 頁稅務法案轉化為程式碼
- LLM 驅動的去匿名化:研究揭露 AI 能大規模精準識別社交媒體化名用戶
- LLM 驅動的網路故障排除:利用 RAG 與微調構建 RCA 知識庫以提升網路韌性
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。