深度分析
RAG‑Pull:利用不可見 Unicode 操控檢索層以影響 RAG 程式碼生成
RAG系統為降低幻覺而引入檢索機制。本研究提出RAG‑Pull,藉由在查詢或程式庫中插入不可見Unicode字元操控檢索向量,將攻擊者控制的惡意程式片段推升至檢索結果前列,最終可能被模型直接生成並導致安全風險,實驗顯示檢索與端到端攻擊成功率極高。
深度分析
RAG系統為降低幻覺而引入檢索機制。本研究提出RAG‑Pull,藉由在查詢或程式庫中插入不可見Unicode字元操控檢索向量,將攻擊者控制的惡意程式片段推升至檢索結果前列,最終可能被模型直接生成並導致安全風險,實驗顯示檢索與端到端攻擊成功率極高。
NoteGen
新發現開源專案NoteGen提供跨平台Markdown筆記與AI寫作輔助,採「先捕捉、後整理」工作流。內建知識庫、向量檢索與混合檢索機制,並支援可擴充模型與代理流程。這提升本地首選的筆記管理與內容重構能力。支援多種同步後端與跨平台部署。包含桌面與行動裝置
MCP
Insight‑Link Pro 宣稱能把大型語言模型的回答綁定到實際程式倉庫與即時文件上,透過三階段執行管線:先探索並映射程式庫結構,接著擷取原始程式碼與線上文件或社群解答,最後綜合來源產出帶引用的回應。專案目標是把每一項主張對應到可驗證來源,降低模型憑空推論,讓開發者在除錯、文件查證與架構理解時取得可追溯的證據與上下文參考。
RAG
Dynamiq是一個開源的代理協調框架,專為代理式人工智慧與大型語言模型(LLM)應用設計。專案以檢索增強生成(RAG)與代理編排為核心,提供Python套件與範例文件,便於開發者在本地或雲端建構多步驟代理工作流。
深度分析
AI代理在長時間、多步交互時常忘記先前狀態,擴大上下文或加重RAG成本高且易脆弱。研究團隊提出delta-mem,一個把歷史互動壓縮為固定大小矩陣並在線更新的記憶模組,能在不改動主模型權重下,透過投影與門控δ規則修正模型推理。
深度分析
研究發現對LLM的大量檢索下,表面>99%成功率可能等同隨機。論文提出Bits-over-Random(BoR)=log2(Pobs/Prand)衡量檢索選擇性,指當λ=K·R̄q/N超過3–5時選擇性崩潰,建議以BoR指引K與工具載入策略。
深度分析
本文探討生產環境下RAG系統失準的根源:檢索而非語言模型出問題。作者提出以混合檢索、大量候選集、多階段排序與統一服務為核心做法,文章強調先廣撒候選再用快速過濾與昂貴重排精煉證據的漏斗式流程。結果顯示,改善檢索架構能顯著降低自信錯誤回答風險。
AnimaWorks
新發現專案AnimaWorks把代理人當作有名字和記憶的組織成員;它以腦啟發記憶(RAG結合向量庫與圖譜)、記憶鞏固與分階忘卻、以及多通道啟發為核心;採 heartbeat 迴路加上排程與 TaskExec 支持長期自治,可能重塑代理人協作與部署模式。
LangChain4j-AIDeepin
LangChain4j‑AIDeepin 是一個以 Java 為主的開源企業級 AI 平台,整合多種人工智慧能力,包含多角色聊天、檢索增強生成(RAG)、圖像生成、視覺化工作流、MCP 外掛市場、語音辨識與語音合成,以及短期與長期記憶等功能。
深度分析
在 UNLP 多領域文件理解競賽中,作者團隊以 Qwen 系列模型構建一套檢索增強(RAG)管線,聚焦於保留文件結構的上下文分段、問題感知的密集檢索與以候選選項為條件的重排,並以受限生成機制完成最終答案選擇。
AnythingLLM
在 GitHub 上的開源專案 AnythingLLM 提供一個可嵌入網站的聊天元件,讓工作區與內建知識庫以聊天泡泡形式對外呈現。該元件支援以 <script> 或 <iframe> 嵌入、會話持續與隨機會話 ID 管理;開發者可在本地以 yarn dev 測試,或以 yarn build 打包後對外部署。
深度分析
本研究針對軟體工程社群中的心理安全語句,對比三款大型語言模型(Claude Haiku、DeepSeek‑Chat、Gemini 2.5 Flash)在零樣本與多例示提示下的質性封閉標註表現。研究以116條人工標註語句為金標準,對每種模型與提示組合重複執行十次,量化 Cohen’s κ、類別 F1 與跨次穩定性。