RAG - Agents Report | 代理人報告 (Page 3)

深度分析

CLAP：結合 LoRA/QLoRA 與 GRPO 的閉環訓練與評估流程提升領域代理人效能

在製造業領域，商業資料常雜訊多、格式不一，導致模型適應困難。研究提出 CLAP閉環訓練‑評估‑釋出流程，將原始資料轉為 SFT、GRPO、評估與門檻資產，並以風險診斷與應用鏈回放決定適配器是否上線。實驗顯示平均分數略升但批次回退仍存，證明僅憑離線分數不足以保證上線效果。

深度分析

PRA‑RAG：可證明魯棒的檢索聚合防止文字中毒攻擊

隨著檢索增強生成被廣泛應用，文字中毒攻擊成為安全盲點。研究提出PRA‑RAG演算法，利用多組檢索組合與最小半徑球選擇穩健子集，將攻擊成功率壓至1%，同時保持71%準確度。此外，作者給出語義偏移上限的理論證明，將最大偏移限制在2R以內，為RAG系統提供可量化的安全指標。

Infographic for OptiMUS-0.3, showing auto MILP modeling with RAG, error correction, and performance gain of 8%-12% and -15% solution time.

深度分析

OptiMUS‑0.3：結合大型語言模型與傳統求解器的自動化 MILP 建模新方案

隨著優化模型需求廣泛，研究推出 OptiMUS‑0.3 以大型語言模型自動生成 MILP 公式，結合檢索增強與錯誤校正，測試顯示在新建 NLP4LP 資料集上比前代提升 8%‑12%。此技術有望降低企業進入門檻，同時也引發模型正確性與資料主權的討論。與產業未來發展方向。

LangGraph framework with MediaPipe and Llama-4-Scout for smart athletic evaluation.

深度分析

LangGraph 多代理框架結合 MediaPipe 與 Llama‑4‑Scout 的智慧運動評估系統

在大規模體育選拔中，傳統人工觀察難以兼顧規模與深度。研究提出以LangGraph協調MediaPipe幾何追蹤與Llama‑4‑Scout視覺語言模型的雙管線架構，並加入3×3SmartGrid影片切片與LLM‑as‑a‑Judge自我校正機制。實驗顯示本地化多代理系統在精準度與延遲上接近雲端基線，同時大幅降低成本與資源需求，此技術亦為本地化AI教練提供可擴展、客觀的評分基礎，預計將改變人才甄選與訓練流程。

Couchbase AI Data Plane infographic showing integrated memory, vector search, and enterprise AI agents.

深度分析

整合記憶層與向量搜尋的 Couchbase AI Data Plane 企業解決方案

Couchbase 推出 AI Data Plane，結合持久代理記憶、即時上下文檢索與企業管理的 MCP 伺服器，支援雲端、內部與斷線邊緣環境。平台以統一持久層與本地向量搜尋提升記憶效能，同時降低 token 消耗。此方案可加速企業部署 AI 代理人，並挑戰其他記憶層服務的市場地位。

速報

高維嵌入空間的相似度集中與檢索不穩定性研究

研究指出，高維嵌入空間會出現距離與餘弦相似度集中現象，導致相似度對比下降，最近鄰檢索變得不穩定，進而削弱生成模型的grounding能力。實驗以多種合成分布驗證，顯示隨維度提升，hub現象與對比崩潰加劇，提示需採用幾何感知的檢索診斷與韌性策略。

深度分析

「提示注入」成企業 AI 最大威脅：全景解析與防護建議

企業大量導入大型語言模型，提示注入成為最嚴重的安全漏洞。攻擊者利用惡意指令竊取憑證、操控自動化流程，已在多家企業實證。OWASP 2025 列為 LLM01，攻擊手法包括跨模型、RAG 鏈毒化、記憶中毒與代理人劫持，影響客服機器人與內部助理。並可能導致資料外洩。

MindGenius AI

開源 MindGenius AI：支援多模型的本地 PDF 解析與動態心智圖生成

MindGenius AI 是一個使用 TypeScript 開發的開源 AI 代理人，能讀取上傳的 PDF 文件，透過內建的檢索增強生成（RAG）即時產生可編輯的心智圖。

深度分析

以大型語言模型驅動的多代理系統模擬教室社會認知不確定性

研究背景：在實際教室中，學生的社會認知受限且存在不確定性。核心技術：以大型語言模型驅動的多代理框架，為每位學生建構主觀圖並使用受限檢索增強生成，加入社交焦慮擾動與信任門控的貝式更新。主要結果：模擬能在不使用全域資訊的情況下，重現真實課堂的群體認知分化與排名誤差，顯示局部互動對認知擴散的關鍵影響。

深度分析

JetBrains 發布 Mellum2：12 B MoE 模型提升文字與程式碼推理效能

JetBrains於2026年6月推出Mellum2，這是一款專為文字與程式碼設計的12 B參數MoE模型。模型每個token僅啟動約2.5 B參數，使推理速度較同規模開源模型提升逾兩倍，且以Apache2.0授權公開。此效能與授權組合有望降低部署成本，加速高頻AI任務。

AI 代理

「Agent Learning」開源平台全攻略：從 LLM 基礎到多代理與 LangGraph 實作路線圖

Agent Learning 是一個 MIT 授權的開源教學專案，提供系統化、實務導向的 AI 代理開發路線圖。內容涵蓋 LLM 基礎、檢索增強生成（RAG）、記憶體、工具呼叫、函式調用、代理工作流、LangChain、LangGraph、模型上下文協定（MCP）、多代理系統、評估、部署與代理強化學習（RL）。

AideAgent

AideAgent：全功能本機 AI 桌面助理的技術解析與生態比較

AideAgent是一款本機優先的開源AI桌面助理，結合聊天、工具呼叫、筆記搜尋與即時網路查詢等功能，讓AI能在本機執行且資料不外流。其多層擴充介面支援自訂技能與MCP協議，提升工作流程自動化與隱私安全。同時支援WeChat橋接與本地RAG檢索，讓使用者可直接在桌面完成資料查找與訊息回覆。

CLAP：結合 LoRA/QLoRA 與 GRPO 的閉環訓練與評估流程提升領域代理人效能

PRA‑RAG：可證明魯棒的檢索聚合防止文字中毒攻擊

OptiMUS‑0.3：結合大型語言模型與傳統求解器的自動化 MILP 建模新方案

LangGraph 多代理框架結合 MediaPipe 與 Llama‑4‑Scout 的智慧運動評估系統

整合記憶層與向量搜尋的 Couchbase AI Data Plane 企業解決方案

高維嵌入空間的相似度集中與檢索不穩定性研究

「提示注入」成企業 AI 最大威脅：全景解析與防護建議

開源 MindGenius AI：支援多模型的本地 PDF 解析與動態心智圖生成

以大型語言模型驅動的多代理系統模擬教室社會認知不確定性

JetBrains 發布 Mellum2：12 B MoE 模型提升文字與程式碼推理效能

「Agent Learning」開源平台全攻略：從 LLM 基礎到多代理與 LangGraph 實作路線圖

AideAgent：全功能本機 AI 桌面助理的技術解析與生態比較

JetBrains 發布 Mellum2：12 B MoE 模型提升文字與程式碼推理效能