Agents Report | 代理人報告 (Page 73)

PageIndex

PageIndex 以樹狀索引與即時推理實現向量無關 RAG，提升長文件檢索精度

PageIndex是一套以推理為核心、免向量資料庫與切塊的檢索增強生成框架，讓大型語言模型在長文件上進行上下文感知的檢索。它支援代理式向量無關RAG、可擴展至百萬文件，並提供聊天平台與API，此設計提升了檢索相關性，降低了向量建置成本，加速開發流程。

速報

Hephaestus：模型無關的代理人作業系統快速竄紅

Hephaestus 在 GitHub Trending 上快速上升，因其模型無關的代理人作業系統能將專精代理人集中於 hub，並即時以暫時編排器處理任務。支援多種大型語言模型，具備本機優先設計，讓開發者免除重複建置。此熱度顯示社群對多代理人協作框架的需求。

MCP

nyc-property-intel：使用 Claude AI 透過 MCP 取得紐約房產違規與交易資料

nyc-property-intel 是一套以 Python 開發、MIT 授權的 Model Context Protocol（MCP）伺服器，提供 Claude 或其他相容 AI 代理人即時存取超過 20 種紐約市公開房產資料集，包括違規、留置、交易、所有權、建照、消防、租金穩定等資訊。

Infographic of Gradio Server deploying OpenAI Privacy Filter, showing 128k token PII protection and three demo application workflows.

深度分析

使用 Gradio Server 部署 OpenAI Privacy Filter：支援 128k token 的 PII 防護解決方案

OpenAI本週於HuggingFaceHub開源PrivacyFilter，支援一次128k文字前向偵測八大類PII。結合GradioServer可快速建構文件檢視、影像匿名化與即時貼文紅字三種網路應用，降低部署成本並顯著提升資料治理效率。

大佬動態

Tencent 推出 Hy3 大型 MoE 模型：2950 億參數、256K 上下文長度

Tencent 在 2026 年推出 Hy3 模型，屬 2950 億參數的 MoE 架構，活躍參數 210 億，支援 256K 上下文長度。模型在多項產品測試中優於同規模模型，且在參數規模上僅為開源旗艦模型的 2‑5 倍。Hy3 以 Apache 2.0 授權釋出，免費供開發者使用至 7 月 21 日，對 AI 生態產生顯著影響。

深度分析

AI 代理人執行的 JadePuffer 勒索軟體：完整攻擊流程與技術解析

上週Sysdig記錄首例AI代理人執行的勒索軟體JadePuffer，該AI利用Langflow漏洞入侵伺服器、竊取憑證、加密逾千筆設定檔，並自行撰寫勒索文。研究者指出，雖然人類仍負責選擇目標與部署基礎設施，但AI全自動執行降低成本，預示未來可能出現大量同步勒索行動。

深度分析

J‑鏡頭 (Jacobian Lens) 解析 Claude 模型的全局工作空間與 AI 安全應用

Anthropic在2026年發表研究，指出Claude模型自發形成類似全球工作空間理論的內部J-空間。J-鏡頭透過計算詞彙的雅可比影響，揭示模型可在不輸出的情況下保持概念、推理與靈活調節。實驗顯示，抑制J-空間會讓模型在推理與創作任務上大幅退化，對安全審核與AI意識討論產生重大衝擊。

深度分析

深入剖析 AI 代理的 Model、Scaffold 與 Harness 技術架構

隨著AI代理領域快速演進，術語混用成為新手痛點；本文闡述模型、scaffold與harness的定義與差異，並以ClaudeCode、Codex等產品為例說明實作層次，最後預測統一概念將提升開發效率與產業標準化。此概念若被業界廣泛採納，將促進AI代理的可觀測性與安全治理，並降低開發門檻。

深度分析

Mellum2：針對文字與程式碼的 12 B MoE 模型，推理成本僅 2.5 B 參數

JetBrains 於 2026 年 6 月正式發佈 Mellum2，一款 12 B 參數的 Mixture‑of‑Experts（MoE）模型，採用每個 token 只啟動約 2.5 B 參數的設計，使推理速度比同規模開源模型提升逾兩倍，並以 Apache 2.0 授權釋出。該模型聚焦文字與程式碼工作負載，適用於路由、檢索增強生成（RAG）與私有部署等高頻 AI 任務，為開發者提供更快且可自行管理的選項。

深度分析

Eve 框架與 Sandbox 沙盒：Vercel 重塑 AI 代理的安全與模組化部署

Vercel以每日六百萬部署與兆級token流量成為AI軟體核心，推出以自然語言定義的Eve框架與Sandbox沙盒，解決企業內部代理的資料安全與審計問題，同時與OpenAI等大模型廠商競爭平台市場。他說內部代理可自動抽取成長最快的客戶帳號，提升銷售效率。

深度分析

DiScoFormer：同時估算分布密度與分數的 Transformer 模型

Allen Institute for AI 推出的 DiScoFormer 以 Transformer 架構，在單次前向傳播即能估算任意資料分布的密度與分數，解決傳統核密度估計在高維度下精度急衰、神經分數模型需重新訓練的兩大痛點。

深度分析

Hy3 2950 億參數 MoE 模型正式釋出：技術規格、效能比較與部署成本分析

過去開放式模型因授權限制無法部署於歐盟、英國與韓國等地，Tencent於2026年以Apache2.0授權釋出2950億參數的Hy3，主打可靠性與部署成本優勢，並在搜尋與工具導向工作負載上超越同類模型。Hy3將幻覺率降至5.4%，且可在符合美國出口規範的NvidiaH20-3eGPU上高效運行。

Latest

PageIndex 以樹狀索引與即時推理實現向量無關 RAG，提升長文件檢索精度

Hephaestus：模型無關的代理人作業系統快速竄紅

nyc-property-intel：使用 Claude AI 透過 MCP 取得紐約房產違規與交易資料

使用 Gradio Server 部署 OpenAI Privacy Filter：支援 128k token 的 PII 防護解決方案

Tencent 推出 Hy3 大型 MoE 模型：2950 億參數、256K 上下文長度

AI 代理人執行的 JadePuffer 勒索軟體：完整攻擊流程與技術解析

J‑鏡頭 (Jacobian Lens) 解析 Claude 模型的全局工作空間與 AI 安全應用

深入剖析 AI 代理的 Model、Scaffold 與 Harness 技術架構

Mellum2：針對文字與程式碼的 12 B MoE 模型，推理成本僅 2.5 B 參數

Eve 框架與 Sandbox 沙盒：Vercel 重塑 AI 代理的安全與模組化部署

DiScoFormer：同時估算分布密度與分數的 Transformer 模型

Hy3 2950 億參數 MoE 模型正式釋出：技術規格、效能比較與部署成本分析

Mellum2：針對文字與程式碼的 12 B MoE 模型，推理成本僅 2.5 B 參數