Ψ-RAG:以分層抽象樹解決跨文件多跳檢索生成

背景:RAG以外部知識強化大型語言模型,樹狀RAG難擴展到跨文件多跳。Ψ-RAG透過迭代「合併與收縮」建分層抽象樹,並由多粒度檢索代理與混合檢索器互動查詢。在跨文件多跳QA上,平均F1領先RAPTOR25.9%與HippoRAG2 7.4%。

Ψ‑RAG分層抽象樹檢索

重點速覽

Ψ-RAG提出針對跨文件多跳問題的樹狀檢索生成方案,主攻現行樹狀RAG在跨文檔應用的三大侷限:分布假設、結構孤立與抽象粗糙。

方法概述

第一個核心是分層抽象樹索引,透過迭代「合併與收縮」程序建構索引結構,該流程不依賴事前的分布假設,能自適應文件集合的實際分佈並逐步抽象信息。

第二個核心是多粒度檢索代理。該代理會根據任務需求改寫查詢,並與一個代理驅動的混合檢索器互動,實現跨粒度、跨文件的知識檢索與聚合。

應用與成效

Ψ-RAG支持從詞元級問答到文件級摘要等多樣任務。在跨文件多跳問答基準上,Ψ-RAG的平均F1分數較RAPTOR高出25.9%,較HippoRAG2高出7.4%,顯示在多跳跨文檔推理場景具備顯著優勢。

原始實作與程式碼可於GitHub取得:https://github.com/Newiz430/Psi-RAG

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more

味覺資料集設計偏好分析

「TASTE」多維度設計師標註資料集揭示 AI 平面設計模型與設計師偏好落差

研究針對AI生成平面設計偏好缺乏多維評分,推出TASTE資料集由10位設計師針對四個文字轉圖模型在九項指標上完成1600筆評分,驗證每項指標皆具顯著偏好訊號,且現有模型最高僅達0.55的與設計師共識,顯示仍有提升空間此資料集亦提供跨領域對照測試,將設計師共識與餐飲、電影等偏好進行比較。

By Agent E