深度分析
向量檢索的學習瓶頸:MED 理論揭示僅需 Θ(k) 維度即可達成完美 top‑k
研究探討向量檢索在top‑k任務的最小可嵌入維度(MED),指出在內積、餘弦相似度與歐氏距離下,所需維度僅與k成Θ(k)關係,與元素數量m無關。進一步的中心點設定顯示維度上界為O(k²log m),說明效能限制主要來自學習可行性而非幾何約束。
深度分析
研究探討向量檢索在top‑k任務的最小可嵌入維度(MED),指出在內積、餘弦相似度與歐氏距離下,所需維度僅與k成Θ(k)關係,與元素數量m無關。進一步的中心點設定顯示維度上界為O(k²log m),說明效能限制主要來自學習可行性而非幾何約束。
ArcRift
GitHub上出現聚焦本機記憶層的新專案,目的為把瀏覽器聊天與開發工具的上下文持久化。ArcRift以瀏覽器外掛與本地MCP伺服器配合SQLite知識圖譜,將對話編入可搜尋記憶並自動注入提示上下文。該作法可讓AI工具跨會話保留記憶,提升開發連貫性與效率。
深度分析
贊助搜尋面臨高吞吐與低延遲的矛盾,HARNESS‑LM以三階段訓練:先以大型SLM訓出高品質teacher,再用ℓ2對齊轉移向量到小型query編碼器,最後以對比微調精煉學生模型。實驗顯示可在保有高精準度的同時大幅降低線上延遲並帶來營收與曝光提升。
direct-corpus-interaction
研究團隊提出「直接語料庫互動(DCI)」,主張讓代理跳過向量嵌入檢索,改由類終端介面直接在原始語料上搜尋與驗證。
深度分析
本文探討生產環境下RAG系統失準的根源:檢索而非語言模型出問題。作者提出以混合檢索、大量候選集、多階段排序與統一服務為核心做法,文章強調先廣撒候選再用快速過濾與昂貴重排精煉證據的漏斗式流程。結果顯示,改善檢索架構能顯著降低自信錯誤回答風險。
llamaindex
這篇報導介紹一個將文件處理、知識圖譜與向量檢索結合的開源平台,採用LlamaIndex與LangChain為管線基礎,支援多種屬性圖與RDF資料庫、多款向量與搜尋引擎,並能自動增量同步資料。此平台旨在提供混合檢索與AI對話功能,對企業導入RAG與知識管理有直接應用價值。
SimpleMem
開源專案SimpleMem提出針對LLM代理的終身記憶方案,支援文本與多模態資料。其設計聚焦有效壓縮、語義向量檢索與知識圖譜式組織,旨在降低儲存與檢索成本並維持上下文關聯。結果可提升代理在長期任務的記憶延續性與檢索效率,便於與RAG流程整合。
速報
Memoria 是一個在 GitHub 出現的開源專案,主張將類 Git 的版本控制應用到 AI 代理的記憶層。專案提供快照、分支、合併與回溯功能,並結合向量與全文混合檢索以語意索引記憶。系統內建矛盾偵測、隔離低信度項與完整稽核鍊,並支援本地嵌入模型以優先保護資料隱私。
mem0
mem0是一個開源的通用記憶層,專為AI代理人設計,提供單次呼叫的新增式記憶與實體連結功能。新演算法在LoCoMo與LongMemEval等基準測試中,Token效能提升逾20%,且延遲維持在一秒以內。此效能提升有望降低長期對話成本,促進本地化AI應用落地。
YAMS
YAMS 是一個針對大型語言模型與應用的持續性記憶系統,採用 SHA‑256 內容位址儲存並支援區塊去重與壓縮。它結合 SQLite 全文搜尋與向量嵌入檢索,提供快照與 Merkle 樹差分管理。此專案仍屬實驗階段,若成功可降低 LLM 記憶成本並提升本地部署彈性。
RAG
一個本地優先的RAG專案,目標把本地文件接入向量檢索與大模型對話。以Go後端、React前端、Qdrant向量庫,支援Ollama或OpenAI相容API,提供文件上傳、索引、檢索增強與會話持久化,利於本地或Docker部署供個人與小團隊自托管驗證。
DiagramBank
DiagramBank是一個針對學術示意圖設計而建的大規模資料集,收錄89,422張來自頂級AI/ML會議的示意圖,並將每張圖與論文標題、摘要、圖說與內文引用片段配對。資料集透過自動化管線抽取PDF中的圖像與對應上下文,並以CLIP類型過濾器分辨示意圖與其他圖表。