檢索增強生成 - Agents Report

深度分析

RAG 知識檢索生成全面解析：從基礎架構到多模態未來

這篇綜述論文從知識驅動的角度全面回顧檢索增強生成（RAG）的發展。文章首先釐清 RAG 的核心元件：檢索機制、生成流程以及兩者間的知識整合。接著提出一套分類法，從基礎的檢索增強模型到整合多模態資料與推理能力的高階架構。文中也詳述常用評估基準與資料集，並探討問答、摘要、資訊檢索等應用場景。

深度分析

GRASP：粒度感知檢索策略的強化學習多步推理框架

隨著大型語言模型在多步推理上需求提升，傳統單次檢索已不足。研究提出 GRASP，透過強化學習讓模型在語意搜尋、關鍵字搜尋與段落閱讀間動態切換，僅在需要時擴充上下文。實驗顯示在 HotpotQA、2WikiMultiHopQA 與 MuSiQue 上，其檢索召回與問答正確率均超過現有單步與提示式基線。

深度分析

結合 Agentic AI 與 RAG 的保險承保自動化：效能比較與產業趨勢

隨著人工智慧從規則自動化演進至Agentic系統，本文以小型商業保險BOP的全自動承保為例，比較單一大型語言模型、簡易檢索增強生成與多代理AgenticRAG三種管線，結果顯示多代理架構在多步驟與資訊缺失情境下能顯著提升決策正確率與可追溯性。

大型語言模型

「awesome-LLM-resources」全景彙整：大型語言模型資源與工具總覽

GitHub上新發現的awesome-LLM-resources彙整全球大型語言模型相關資源，涵蓋多模態、Agent、資料處理等領域。該清單以開源授權為主，持續更新，為研究與開發者提供快速索引，提升資源搜尋效率。此專案已獲8,600+星標，顯示社群高度關注。

深度分析

PRA‑RAG：可證明魯棒的檢索聚合防止文字中毒攻擊

隨著檢索增強生成被廣泛應用，文字中毒攻擊成為安全盲點。研究提出PRA‑RAG演算法，利用多組檢索組合與最小半徑球選擇穩健子集，將攻擊成功率壓至1%，同時保持71%準確度。此外，作者給出語義偏移上限的理論證明，將最大偏移限制在2R以內，為RAG系統提供可量化的安全指標。

深度分析

多代理人 RAG 平台 Carolina Guide 提升大學政策查詢效率與安全防護

在大學學務諮詢常見資訊瓶頸下，Carolina Guide 以多代理人檢索增強生成系統，結合關聯式資料庫與向量索引、硬性安全防護與必備引用，於90筆測試中達成98.9%檢索成功與0.89安全F1，展現校內政策輔助的可行性。系統亦支援即時回應與部門自治的維護機制，確保政策更新可即時反映於服務。

深度分析

Domain‑Collection‑Document (DCD) 於 RAG 系統的層級檢索與生成效能分析

隨著知識庫規模與查詢複雜度提升，傳統檢索增強生成（RAG）常因平面表示與缺乏工作流程而效能下降。研究提出 DCD（Domain‑Collection‑Document）層級架構，透過分域與分集合限制檢索範圍。實驗顯示在多步查詢與異質語料下，DCD 在上下文召回與事實正確率上優於一般 RAG。

深度分析

格式驅動的注意力偏差：結構注意稅在 RAG 系統中的實驗分析

本研究探討檢索增強生成中知識圖譜格式如何影響注意力分配，提出結構注意稅概念，發現三元組每 token 吸收注意力約為自然語句的 2–3 倍，導致示範注意力壓縮最高 42%。透過語意與結構分解，指出優化檢索內容與降低格式驅動注意力是兩條獨立改進路徑，並驗證格式平坦化等緩解策略的效益。

深度分析

超智慧檢索代理 SIRA：結合 LLM 與 BM25 的一次性多輪搜尋解決方案

隨著對話式搜尋需求提升，傳統檢索多回合成本高。研究提出超智慧檢索代理（SIRA），利用大型語言模型在語料與查詢兩側補齊關鍵詞，並以文件頻率過濾，最終以單次加權 BM25 完成檢索。實驗顯示在十項 BEIR 基準與下游問答任務上，SIRA 超越密集向量與多回合基線，達到最高的 Recall@10 與 NDCG@10。

速報

多頭注意力檢索增強生成 (MHA‑RAG) 大幅提升基礎模型效能與效率

將基礎模型應用於資料稀少的新領域通常成本高且效能不佳。研究團隊提出以軟提示取代純文字示例，並設計示例順序不變的模型架構，命名為 Multi‑Head Attention Retrieval‑Augmented Generation（MHA‑RAG）。

深度分析

FIDES：Token 級別對比控制提升檢索增強生成的答案忠實度

本篇報導介紹 FIDES（Faithful Inference via Deep Evidence Signals），一種不需額外訓練的對比式解碼器。它在輸出層、隱藏層與預測軌跡三個深度上擷取衝突訊號，依 token 的衝突程度動態調整對比係數，從而在檢索證據與模型記憶衝突時抑制頑固幻覺。

深度分析

MAAD：結合檢索增強生成與階層記憶的多代理軟體架構設計框架

隨著軟體需求日益複雜，傳統架構設計耗時且依賴專家經驗。MAAD透過四個專職代理、檢索增強生成與階層記憶，自動將需求轉為完整多視圖架構，實驗顯示其完整度、模組化與可追蹤性均優於MetaGPT。同時，評估代理自動生成的品質報告大幅降低人工驗證工作量，證明此技術可加速企業架構迭代。