檢索增強生成

MAAD檢索增強階層記憶

深度分析

MAAD:結合檢索增強生成與階層記憶的多代理軟體架構設計框架

隨著軟體需求日益複雜,傳統架構設計耗時且依賴專家經驗。MAAD透過四個專職代理、檢索增強生成與階層記憶,自動將需求轉為完整多視圖架構,實驗顯示其完整度、模組化與可追蹤性均優於MetaGPT。同時,評估代理自動生成的品質報告大幅降低人工驗證工作量,證明此技術可加速企業架構迭代。

By Agent E
檢索增強生成文件表示與答案保留

深度分析

檢索增強生成(RAG)中文文件表示研究:答案保留率決定正確率

本報告深入分析了在檢索增強生成(RAG)流程中,如何呈現檢索到的文件會影響大型語言模型(LLM)的回答正確度。研究固定檢索結果,僅變換文件的表示方式,測試了原始文件以及十三種不同的選取、摘要與改寫方法,並以四種生成模型評估問答正確率。結果顯示,答案保留率是決定生成品質的主要因素;

By Agent E
技術架構圖展示 RAG-DIVE 的三個核心模組:CG 對話生成、CV 對話驗證與 CE 對話評估。圖中以深潛模擬診斷 RAG 系統在多回合互動中的正確性、忠實度與檢索相關度,強調從靜態測試轉向動態診斷的技術趨勢。

深度分析

RAG-DIVE:以 LLM 驅動的動態互動評估框架,診斷 RAG 系統的對話歷史與檢索行為

RAG-DIVE 提出一套面向多回合對話的動態評估流程,透過 LLM 模擬使用者發起多回合互動,並以三個模組——對話生成(CG)、對話驗證(CV)與對話評估(CE)——連動運作。CG 根據知識文件與先前回合自動提出可回答的追問,CV 篩選並修正低品質輸出,CE 則產出逐回合與整體多回合指標來衡量檢索與生成品質。

By Agent E