速報
AmanMCP:零設定本地 RAG 與向量搜尋利器
在開源社群中登場的 AmanMCP,是一個以本地化 RAG(Retrieval-Augmented Generation)為目標的工具,強調零設定與隱私優先。專案結合傳統 BM25 檢索與向量搜尋技術,採用 HNSW 索引與 hybrid-search 策略,並利用 tree-sitter 處理程式碼語法結構,支援多種模型介接選項。
速報
在開源社群中登場的 AmanMCP,是一個以本地化 RAG(Retrieval-Augmented Generation)為目標的工具,強調零設定與隱私優先。專案結合傳統 BM25 檢索與向量搜尋技術,採用 HNSW 索引與 hybrid-search 策略,並利用 tree-sitter 處理程式碼語法結構,支援多種模型介接選項。
深度分析
醫療大語言模型通常以放大模型、延長語境或檢索來提升準確。本文以 SaFE-Scale 框架與 RadSaFE-200 評測不同部署條件,逐一比較乾淨證據、衝突證據、標準與代理式 RAG 等做法,發現只有高品質臨床證據能同時改善準確與安全,其他擴增手段無法取代。
深度分析
本文改寫自一項匿名安全評估,檢視一個公開可訪問的病患面向 RAG(檢索增強生成)醫療聊天機器人。研究採取非破壞性的兩階段方法,先以大型語言模型輔助探索可能漏洞,再用瀏覽器開發者工具逐項驗證。結果揭示系統透過瀏覽器可讀的客戶端–伺服器通訊洩露大量敏感設定與紀錄,包括完整 RAG 配置、知識庫內容與最近存檔的病患對話。
速報
GitHub上出現SmartCall-Agent,一個聚焦語音外呼的模組化AI平臺。專案把檢索增強生成(RAG)與語音處理鏈結合,包含自動語音辨識(ASR)、大模型回應、文字轉語音(TTS),並接入LiveKit做即時通話、Plivo等電信介面,以及向量資料庫與JWT驗證。
深度分析
企業在建置檢索增強生成系統時,常因通用嵌入模型無法捕捉專業文件細節而受阻。NVIDIA提供以單張GPU、不到一天完成的Nemotron領域微調流程,透過自動合成問答與硬負例挖掘,將Recall@60提升至95%。此技術可縮短開發週期並降低標記成本,對企業AI部署產生顯著效益。
大型語言模型
Awesome-AI-Memory 是一個以 Apache‑2.0 授權釋出的開源資源庫,專門彙整與大型語言模型(LLM)記憶相關的最新研究、工具與實作案例。隨著 LLM 受限於上下文窗口長度,外部持久記憶成為突破短期記憶瓶頸的關鍵技術。
深度分析
開發者過去依賴索引層、查詢引擎等腳手架建構LLM應用,LlamaIndex CEO Jerry Liu認為模型已能自行處理大量非結構化資料,框架需求縮減,語境解析與模組化成為新核心,業界必須調整堆疊策略。同時MCP與ClaudeAgentSkills讓模型即時發現並使用工具,降低整合成本。
深度分析
近年來大型語言模型(LLM)在自動化滲透測試領域展現潛力,尤其在雲端模型因安全、隱私與主權問題受到限制。研究以本地部署的開源 LLM 為目標,針對 Linux 權限提升任務進行系統化實驗,提出五項提升技巧,包括鏈式思考、檢索增強、結構化提示、歷史壓縮與反思分析,並整合於 hackingBuddyGPT 框架。
深度分析
VBPulse調查指出2026年第一季企業對混合檢索的採用意願在一季內由10.3%增至33.3%。企業從單一向量檢索轉向結合稠密向量、關鍵字搜尋與重排的混合架構,以求在代理化工作負載下取得檢索精準與運行可靠性的平衡。檢索層成為企業能否在大規模代理應用維持可信度與合規性的關鍵之一。
RAG
Pathway的llm-app提供即用RAG與AI管線範本,能與GoogleDrive、Sharepoint、S3、Kafka、PostgreSQL等資料來源即時同步,內建向量檢索、混合檢索與全文索引,方便本機測試後部署到雲端或內部環境以強化企業搜尋與即時問答能力。
深度分析
面對日增的多模態錯誤資訊,MIRAGE提出一套可插拔的推理框架,將驗證工作分為四個連續模組:視覺真偽檢測、跨模態對齊評估、檢索增強事實查證與整合判斷。系統以視覺-語言模型負責結構化推理,並透過網路檢索回溯來源與引用,輸出具引用的結論與理由。
深度分析
在電商與廣告快速擴張的場景下,Xiaohongshu 面臨大量自然語言驅動的即時商業分析需求。