向量資料庫 - Agents Report

LangChain

使用 langchain-milvus 套件實作向量儲存、混合檢索與非同步 RAG

LangChain 與 Milvus 的新整合套件提供向量儲存、相似度搜尋與混合檢索功能，支援非同步操作與多向量欄位，讓開發者能快速建置語意搜尋與 RAG 應用，提升 AI 系統效能與彈性。此套件同時支援稀疏向量與內建 BM25 檢索，適用於大型語意搜尋與推薦系統。

WeKnora

WeKnora：結合 RAG 與自動維基的 Go 語言開源 LLM 解決方案

WeKnora 是由騰訊開源的 LLM 知識平台，將原始文件轉換為可檢索的向量庫、自治推理代理與自動維基，使用 Go 語言實作，已獲超過 1.7 萬星標，平台支援向量搜尋、重新排序與多模型嵌入，並提供 API 與多租戶管理介面，適合建置企業內部問答與自動化維基系統。

深度分析

向量資料庫的細粒度存取控制：策略選擇與實驗效能分析

隨著向量資料庫在生成式AI與企業資訊檢索中的應用增長，細粒度存取控制成為安全瓶頸。研究提出四種策略—前置過濾、後置過濾、迭代與平行過濾，並以pgvector實驗比較召回率與延遲。結果顯示前置過濾在高選擇性下表現最佳，平行過濾在中等選擇性可兼顧效率與正確性，為未來多租戶AI系統提供參考。

OneRAG

OneRAG：Python 與 FastAPI 結合的即插即用 RAG 框架，支援六大向量資料庫與五種大型語言模型

OneRAG是以Python與FastAPI為基礎的即插即用RAG框架，支援六種向量資料庫與五種大型語言模型，提供OpenAI相容API、完整測試與Docker/CLI快速部署，讓開發者能從原型迅速上線。只要修改.env或YAML，即可切換向量資料庫、LLM、Reranker與快取。

Model Context Protocol

Model Context Protocol (MCP) 開源工具箱：結合 LangChain、CrewAI 與向量資料庫快速構建 Agentic AI 代理

MCP讓開發者能以簡易步驟建置AgenticAI與生成式AI代理，結合LangChain、CrewAI等工具，支援向量資料庫與Docker部署，快速落地應用。跨平台、低配需求、開源MIT授權，適合團隊快速驗證AI工作流。同時支援向量資料庫如ChromaDB、FAISS與Pinecone，降低資料檢索。

Awesome Architecture

Awesome Architecture：雙語架構圖譜聚焦 AI 閘道、RAG 與向量資料庫，GitHub Trending 爆紅

study8677 的 Awesome Architecture 在 GitHub Trending 短時間內激增，收錄 21 份雙語架構圖譜，涵蓋 AI 閘道、RAG、Agent 設計與向量資料庫等，提供從需求拆解到決策記錄的系統化教學，提升工程師的設計判斷力。

深度分析

AWS OpenSearch Serverless 支援 AI 代理人：計算與儲存解耦、向量搜尋按需擴展

網路長期以人類行為為設計前提，AI代理人卻帶來短時高峰與大量機機互動。AWS新版OpenSearchServerless透過計算與儲存解耦、秒級擴縮與閒置歸零的計費機制，為代理人工作負載提供即時、可計量的搜尋與向量檢索解決方案。此設計可能促進代理人大規模部署並重塑企業資料檢索模式。

深度分析

Pinterest 用 Qwen3‑VL 改造視覺層：以自有多模態向量嵌入降本 90%、準確度提升 30%

Pinterest 面對數億用戶的視覺推薦場景，工程團隊選擇不再逐張呼叫大型前沿模型，而是把 Qwen3‑VL 的視覺編碼層抽換為自有多模態向量嵌入，並將圖像與 Pin 的 metadata 做離線預計算與定期重訓。此策略一方面顯著降低雲端推理成本與延遲，另一方面提升推薦準確度與個人化效果。

aimock

aimock全方位 AI Mock 伺服器：支援 LLM、MCP 與向量資料庫測試

aimock 是一個在 GitHub 上活躍的開源專案，主打以單一套件、單一埠、零相依的方式，模擬 AI 應用在測試階段會呼叫到的各類服務。功能涵蓋 LLM API、多媒體生成、語音與影音處理、嵌入向量、向量資料庫、搜尋與重排序，以及 MCP 工具與代理間通訊（A2A）等。

系統設計

Awesome Architecture：21 張架構地圖與系統設計指南，含人工智慧閘道、RAG、Agent 與向量資料庫

「Awesome Architecture」是一個聚焦架構思維的雙語開源知識庫，收錄教學與 21 張真實系統的架構模板，涵蓋人工智慧閘道、RAG（檢索增強生成）、Agent 化設計、推理服務與向量資料庫等主題。

向量資料庫

LEANN：以圖形化按需重算與高階節點修剪實現低資源本地向量資料庫

LEANN是一個以個人裝置為目標的向量資料庫專案，主打在不犧牲檢索準確度下大幅降低儲存需求。它以圖形化的選擇性重算（graph-based selective recomputation）和高階節點保留修剪策略，改為按需計算embedding而非長期存放，藉此減少磁碟佔用並維持語意搜尋效能。

深度分析

RAG 醫療聊天機器人洩露風險：向量資料庫、API 配置與病患資料外洩實證

本文改寫自一項匿名安全評估，檢視一個公開可訪問的病患面向 RAG（檢索增強生成）醫療聊天機器人。研究採取非破壞性的兩階段方法，先以大型語言模型輔助探索可能漏洞，再用瀏覽器開發者工具逐項驗證。結果揭示系統透過瀏覽器可讀的客戶端–伺服器通訊洩露大量敏感設定與紀錄，包括完整 RAG 配置、知識庫內容與最近存檔的病患對話。