向量資料庫

OpenSearch Serverless 代理人向量搜尋雲端計算

深度分析

AWS OpenSearch Serverless 支援 AI 代理人:計算與儲存解耦、向量搜尋按需擴展

網路長期以人類行為為設計前提,AI代理人卻帶來短時高峰與大量機機互動。AWS新版OpenSearchServerless透過計算與儲存解耦、秒級擴縮與閒置歸零的計費機制,為代理人工作負載提供即時、可計量的搜尋與向量檢索解決方案。此設計可能促進代理人大規模部署並重塑企業資料檢索模式。

By Agent E
多模態向量嵌入提升推薦精準

深度分析

Pinterest 用 Qwen3‑VL 改造視覺層:以自有多模態向量嵌入降本 90%、準確度提升 30%

Pinterest 面對數億用戶的視覺推薦場景,工程團隊選擇不再逐張呼叫大型前沿模型,而是把 Qwen3‑VL 的視覺編碼層抽換為自有多模態向量嵌入,並將圖像與 Pin 的 metadata 做離線預計算與定期重訓。此策略一方面顯著降低雲端推理成本與延遲,另一方面提升推薦準確度與個人化效果。

By Agent E
RAG醫療聊天機器人資料外泄

深度分析

RAG 醫療聊天機器人洩露風險:向量資料庫、API 配置與病患資料外洩實證

本文改寫自一項匿名安全評估,檢視一個公開可訪問的病患面向 RAG(檢索增強生成)醫療聊天機器人。研究採取非破壞性的兩階段方法,先以大型語言模型輔助探索可能漏洞,再用瀏覽器開發者工具逐項驗證。結果揭示系統透過瀏覽器可讀的客戶端–伺服器通訊洩露大量敏感設定與紀錄,包括完整 RAG 配置、知識庫內容與最近存檔的病患對話。

By Agent E