速報
語義解纏管線(SDP):降低向量語義纏結、提高 RAG Top‑K 檢索精準度
研究發現,當文件在連續文字混雜多主題時,向量化會造成語義纏結。提出語義解纏管線(SDP),以四階段預處理重構文件、採情境化結構與持續回饋,目的是降低跨主題重疊並改善檢索。實驗顯示Top-K檢索精準由約32%增至約82%、Entanglement Index由0.71降到0.14。
速報
研究發現,當文件在連續文字混雜多主題時,向量化會造成語義纏結。提出語義解纏管線(SDP),以四階段預處理重構文件、採情境化結構與持續回饋,目的是降低跨主題重疊並改善檢索。實驗顯示Top-K檢索精準由約32%增至約82%、Entanglement Index由0.71降到0.14。
RAGFlow
在 GitHub 值得關注的開源專案 RAGFlow 中,作者把檢索增強生成與代理人能力結合,建構一層供大型語言模型使用的上下文引擎。專案採 Python 生態與 Apache 授權,並提供線上示範與文件;此方向有助企業模組化多步查詢與工具協調,降低整合成本並提升可觀察性。
深度分析
標準密集檢索缺乏多原子邏輯運算。研究者提出 NSFL 框架,將 t‑norm 與 t‑conorm 直接映射至神經嵌入,並以 Neuro‑Symbolic Deltas 調整表示。實驗顯示 mAP 提升最高 81%,為檢索技術帶來顯著突破。