RAG - Agents Report | 代理人報告 (Page 4)

Rust

Rust 核心的 Aura AI 代理平台：整合 MCP、RAG 與 OpenTelemetry 的生產就緒解決方案

Aura 是一套以 Rust 為核心、採用宣告式 TOML 配置的開源 AI 代理框架，專為 SRE 工作設計。它整合 Model Context Protocol（MCP）工具發現、支援檢索增強生成（RAG）管線，並提供與 OpenAI 相容的 Web API、認證、串流與錯誤處理機制。

深度分析

TRACE‑KG：結合大型語言模型的高召回知識圖譜自動建構框架

隨著大型語言模型支援文件檢索，研究提出TRACE‑KG框架，透過多階段抽取與資料驅動的schema誘導，生成可追溯且含條件限定的知識圖譜。實驗顯示其在結構完整性與查詢正確性上優於傳統方法。此外，框架以多模態文件文字化、段落分割與LLM導向的行動函式，保留每筆證據的來源標記，提升審核與維護效率。

深度分析

Generation Networks：圖形機率模型在 LLM 原生軟體生成流程的應用

工程師在開發以大語言模型為核心的軟體時，仍多依賴試驗與提示設計，缺乏正式的抽象與文件化機制。本文提出以圖形機率模型描述生成流程的「Generation Networks」框架，將 LLM 的隨機、提示依賴行為以有向無環資料相依圖呈現，並引入分布控制與領域選擇變數以捕捉不同資料來源下的行為差異。

深度分析

NVIDIA 單卡一天完成領域嵌入模型微調，提升 RAG 檢索效能

隨著企業在RAG系統中遭遇通用嵌入模型無法捕捉領域細節的瓶頸，Nvidia推出單卡一天完成微調的流程，利用合成問答與硬負樣本提升檢索效能，實測Recall@60提升至95%。此流程免標註、結合硬負樣本與多跳問題，於單張A100或H100完成，NDCG@10提升逾10%。

深度分析

PixelRAG 透過視覺檢索取代文字解析：架構、訓練與實驗成果

研究指出傳統文字解析在企業RAG中損失關鍵訊號，PixelRAG直接以螢幕擷取圖像作檢索，提升準確度最高18%。此法亦大幅降低代幣成本。研究團隊來自加州大學柏克萊、普林斯頓與EPFL，測試30億截圖覆蓋全維基，六項基準皆優於文字RAG。顯示視覺檢索的潛力。

深度分析

「DailyReport 基準」評估搜尋代理人於大型語言模型的事實性與推理表現

DailyReport 基準針對真實使用者的日常資訊需求，收集 150 個開放式搜尋任務與 3,546 條細部評分規範，覆蓋 10 大領域與 35 細分類。基於層疊式 rubrics，從指令遵循、事實性、推理合理性三個維度逐層評分，並以使用者偏好分數進行彙總。

深度分析

「LCLM」潛在上下文語言模型：實現 16 倍壓縮與 8.8 倍推論加速

隨著大型語言模型（LLM）上下文窗口持續擴大，記憶體與計算資源成為主要瓶頸。NYU、哈佛等多所大學與實驗室聯手提出潛在上下文語言模型（LCLM），在解碼前先壓縮輸入序列，最高可達 16 倍壓縮率。

深度分析

格式驅動的注意力偏差：結構注意稅在 RAG 系統中的實驗分析

本研究探討檢索增強生成中知識圖譜格式如何影響注意力分配，提出結構注意稅概念，發現三元組每 token 吸收注意力約為自然語句的 2–3 倍，導致示範注意力壓縮最高 42%。透過語意與結構分解，指出優化檢索內容與降低格式驅動注意力是兩條獨立改進路徑，並驗證格式平坦化等緩解策略的效益。

深度分析

基於注意力不變性的 SIFT 技術：加速 RAG 首 Token 時間的稀疏注意力方案

研究顯示，RAG生成因文件重複導致算力浪費，SIFT透過離線分析注意力不變性，只儲存高注意力位置的位元向量，於推論時稀疏計算，提升首 token 時間最高1.71倍，且精度損失不到1%。此方法減少KV快取磁碟讀寫，僅佔原始資料千分之一，適用於大型模型的即時服務。

深度分析

SciDER 以自我演化記憶與 RAG 提升科研全流程自動化

SciDER 是一套以資料為核心的全端科研系統，結合四個專門的 LLM 代理人與自我演化記憶機制，從原始實驗資料的解析、假說生成、實驗程式碼撰寫到批判回饋全部自動化。相較於 AI Scientist、TinyScientist 等僅支援概念發想或缺乏記憶的框架，SciDER 能直接處理多領域的原始數據，並在測試階段持續學習累積專案經驗。

深度分析

以 1/Ratio@k 評估 ANN 檢索品質：實驗結果、下游影響與 LEANN 應用

近似最近鄰搜尋常以Recall@k評估，但此指標忽視結果品質。研究提出以1/Ratio@k取代，能在相同效能下提供更真實的品質衡量，實驗顯示在圖像分類與檢索增強生成任務中，1/Ratio@k與下游表現高度相關，且成本更低。同時為LEANN等向量資料庫提供效能與儲存的平衡參考。

深度分析

檢索增強生成（RAG）中文文件表示研究：答案保留率決定正確率

本報告深入分析了在檢索增強生成（RAG）流程中，如何呈現檢索到的文件會影響大型語言模型（LLM）的回答正確度。研究固定檢索結果，僅變換文件的表示方式，測試了原始文件以及十三種不同的選取、摘要與改寫方法，並以四種生成模型評估問答正確率。結果顯示，答案保留率是決定生成品質的主要因素；