深度分析
Lyzr Cognis:以雙儲存(OpenSearch + 向量庫)與混合檢索強化對話式LLM的持久記憶
面對對話式大模型缺乏持久記憶,研究提出LyzrCognis:以雙儲存層(OpenSearchBM25+向量檢索)與RRF融合,寫入時採語境感知抽取決定新增或更新,加入時間加權與BGE-2重排以強化時序查詢與版本回溯。實驗於LoCoMo與LongMemEval顯著領先。
深度分析
面對對話式大模型缺乏持久記憶,研究提出LyzrCognis:以雙儲存層(OpenSearchBM25+向量檢索)與RRF融合,寫入時採語境感知抽取決定新增或更新,加入時間加權與BGE-2重排以強化時序查詢與版本回溯。實驗於LoCoMo與LongMemEval顯著領先。
Claude Code
claude-mem 是一個針對 Claude Code 的開源記憶壓縮系統,能自動擷取開發會話內容、以模型壓縮並持久化儲存,於未來工作階段回填相關上下文。專案以 TypeScript 開發、支援多種記憶後端與嵌入向量,README 顯示多語系說明與相容性資訊,並在社群獲得高度關注。
AI 代理
該GitHub倉庫彙整可執行的100多個AI代理與RAG範本,原始檔案以Python為主,列出代理、語音代理與檢索增強流程的樣板,並標示可配合的多家大型語言模型;對開發者而言,資源能降低上手門檻並加速原型驗證與部署。
深度分析
隨著 AI 代理需求提升,本文介紹 Mem0 結合 OpenAI 與 ChromaDB 的長期記憶架構。透過自動抽取、語意搜尋與 CRUD 管理,實作使用者層級的持久化記憶,並示範多使用者資料隔離與自訂設定。結果顯示,記憶增強可使對話保持上下文連貫,提升個人化回應與系統可擴展性。(原文未詳述)
檢索增強生成
GitHub 新發現 RAG_Techniques 專案提供多項檢索增強生成技術教學,涵蓋 LangChain、LlamaIndex 與向量資料庫整合。結合 UltraRAG、VimRAG 與 Databricks 多步驟代理人等最新研究,提升多模態與混合查詢效能。此專案為台灣 AI 開發者提供可落地的實作範例與產業應用洞見。
UltraRAG 3.0
UltraRAG 3.0於2026年1月正式發布,提供低程式碼的多模態RAG框架。核心採用可視化推理與AgentCPM-Report模型,支援文字、影像與向量檢索。此框架降低開發門檻,預期加速台灣企業的生成式AI應用部署。
深度分析
隨著機密文件外洩風險升高,研究提出檢索增強分類(RAC)作為低洩漏的辨識方案。RAC 結合外部向量庫與相似度匹配,在平衡與不平衡資料上均達 96% 正確率,F1 可至 94%。相較於需重新訓練的監督式微調,RAC 可即時重新索引新文件,降低參數洩漏並提升治理彈性,對企業合規部署具實務價值。