深度分析
DMF:以決定性訊號分析實現對話式 AI 零代幣記憶管理
隨著對話式AI需要更長上下文,傳統以大型語言模型生成摘要的記憶方式因非決定性與高代價受限。研究提出DeterministicMemoryFramework(DMF),以純CPU、向量與數學打分取代生成壓縮,透過SurvivalScore與互動次數衰減模型維持記憶。實驗顯示DMF在準確度相當前提下,記憶管理代幣消耗降低至零至千分之五,顯示未來可望打造可審計且成本友好的對話記憶系統。
深度分析
隨著對話式AI需要更長上下文,傳統以大型語言模型生成摘要的記憶方式因非決定性與高代價受限。研究提出DeterministicMemoryFramework(DMF),以純CPU、向量與數學打分取代生成壓縮,透過SurvivalScore與互動次數衰減模型維持記憶。實驗顯示DMF在準確度相當前提下,記憶管理代幣消耗降低至零至千分之五,顯示未來可望打造可審計且成本友好的對話記憶系統。
速報
ELSAKKK 開源的 Mnemos-MCP 近期在 GitHub Trending 上快速攀升,吸引開發者注意。這是一套以 Python 撰寫的私有知識伺服器,提供多集合隔離、決定性匯入與本地向量搜尋等功能,讓文件可在本機安全且高效地被索引與查詢。
速報
隨著向量相似度搜尋結合時空篩選需求激增,傳統將向量索引嵌入 R 樹的做法會造成碎片化,查詢必須呼叫多個子索引,效能受限。研究提出 CubeGraph,使用階層格子劃分空間,於查詢時即時串接相鄰格子圖,實現單次遍歷即找最近鄰。實驗顯示相較於現有基準,查詢速度與擴展性皆有顯著提升。
RAG
Pathway的llm-app提供即用RAG與AI管線範本,能與GoogleDrive、Sharepoint、S3、Kafka、PostgreSQL等資料來源即時同步,內建向量檢索、混合檢索與全文索引,方便本機測試後部署到雲端或內部環境以強化企業搜尋與即時問答能力。
Claude Context
Claude Context 為 AI 編碼代理人提供全程式碼向量搜尋,利用向量資料庫將相關程式碼注入 Claude 的上下文,減少多輪搜尋成本。插件支援 TypeScript 與 VS Code,讓開發者快速取得所需程式碼。此技術提升開發效率,同時降低大型程式碼庫的使用費用。