Agents Report | 代理人報告 (Page 50)

深度分析

「Mythos」與 Project Glasswing：半自主 AI 代理打造開放式資安防禦新格局

在 Mythos 與 Project Glasswing 推出後，全球機構正面臨 AI 資安新局。Mythos 以大型語言模型結合高算力與自動化修補框架，能自動偵測、驗證、協調與布署漏洞修補。此開放式架構降低防禦者與攻擊者的能力差距，提升高風險組織的資安韌性。

desktop-touch-mcp

「desktop-touch-mcp」：基於 Rust UIA 引擎的 Windows 桌面 AI 代理新方案

Desktop‑Touch‑MCP 在 GitHub Trending 中快速竄升，提供 Windows 桌面語意 discover‑then‑act 自動化。它使用 Rust UIA 引擎在 2 毫秒內完成焦點查詢，並加入每次操作感知防護，避免錯誤視窗輸入。此專案讓 AI 代理能安全、快速地控制本機應用程式，提升本地自動化效能。

深度分析

Open ASR Leaderboard 引入私密高品質語音資料集，提升 WER 評測可信度

Open ASR Leaderboard 為防止測試集污染，加入由 Appen 與 DataoceanAI 提供的私密高品質英語語音資料，涵蓋腳本與對話、不同口音。透過資料切換功能與統一正規化流程，使用者可選擇是否計入私密資料的 WER。此舉提升評測可信度，同時降低模型針對公開測試集的優化漏洞。

深度分析

解決 train‑inference mismatch：vLLM V1 後端校正與 RL 目標優化指南

ServiceNow‑AI在將推論引擎從vLLM V0升級至V1時，發現RL訓練指標偏離，透過修正logprob語義、統一執行預設值、同步權重更新路徑，並將lm_head設為fp32，使V1的訓練曲線與V0基準重新對齊，確保推論後端行為一致性。

深度分析

「非同步批次」與 CUDA 串流結合提升 LLM 推論 GPU 效能約 24%

隨著 LLM 推論需求提升，持續批次已成效能關鍵。傳統同步批次因 CPU 與 GPU 輪流等待，導致近四成時間空閒。本文說明如何利用 CUDA 串流與事件實作非同步批次，讓 CPU 與 GPU 同時工作，提升約 24% 效能，並探討其對雲端推論成本與開發者生態的影響。

深度分析

AI 幻覺與供應鏈安全：Slopsquatting 攻擊手法與防禦策略

隨著大型語言模型（LLM）在程式開發中的廣泛應用，AI 幻覺產生的虛構套件名稱正成為供應鏈攻擊的切入口。研究指出，攻擊者可註冊這些幻覺套件，將惡意程式碼注入開發者的專案，形成所謂 Slopsquatting。

Lanhu MCP Server

Lanhu MCP Server 2.0：自動需求分析與 UI 設計支援的開源協作平台

Lanhu MCP Server 以 Model Context Protocol 為基礎，提供自動需求分析與 UI 設計稿切圖功能，支援多種 AI 編程工具共享團隊知識，提升開發效率並降低重複工作，此伺服器採用 Python 3.10+，結合 FastMCP 高效快取機制，適用於藍湖設計平台的協作流程。

OpenKnowledge

OpenKnowledge：全真 WYSIWYG AI Markdown 編輯器與本地部署 LLM Wiki 解決方案

OpenKnowledge 是一款以 AI 為核心的 markdown 編輯器，支援 Claude、Codex 等大型語言模型，提供 WYSIWYG 介面與本地化、免費使用。它可透過 npm 安裝，支援 macOS 桌面與 Web 版，並內建團隊共享與 Git 同步功能。此專案有超過 2500 星，預計將提升台灣開發者的知識管理效率。

NeuroLink

NeuroLink：以 TypeScript 串流 API 結合多家 LLM、MCP 與 Edge‑first 架構

Juspay推出的NeuroLink為AI整合平台，統一21+供應商與百餘模型的介面，支援即時語音、記憶與RAG，企業可透過單一參數切換供應商並自動優化成本，提升開發效率與資料主權。同時支援本地部署與MCP伺服器，內建Redis記憶與多供應商容錯機制，並以Edge‑first架構降低延遲。

mcpx

使用 mcpx 以指令列方式呼叫 MCP 伺服器：安裝與核心指令指南

mcpx 是一套以 Go 語言實作、MIT 授權的開源指令列工具，旨在將 Model Context Protocol（MCP）伺服器的功能以可組合的 CLI 方式直接呼叫。使用者只要安裝後即可透過簡潔指令列列舉伺服器、查詢工具、執行工具，輸出保持原始文字或 JSON，方便後續 pipe、jq 解析。

AI 代理

Auto‑Empirical Research Skills (AERS)：超過 2.3 萬條 Stata AI 代理技能的實證研究資源庫

GitHub 上的 Auto-Empirical Research Skills (AERS) 由斯坦福 REAP 與 CoPaper.AI 合作打造，彙集超過 23,000 條 AI 代理技能，涵蓋經濟、政治、心理等八大社會科學領域。

Learn‑LikeCC

Learn‑LikeCC：開源逆向 Claude Code 全方位教學平台解析（TypeScript 實作）

Learn‑LikeCC專案在GitHub上公開，提供ClaudeCode源碼逆向、可執行復刻與教學課程。透過TypeScript原始碼、SourceMap與LoopLab仿真，讓開發者探索AgentHarness、MCP與模型切換機制。此專案有望加速本地AI代理研究與教育應用。

Latest

「Mythos」與 Project Glasswing：半自主 AI 代理打造開放式資安防禦新格局

「desktop-touch-mcp」：基於 Rust UIA 引擎的 Windows 桌面 AI 代理新方案

Open ASR Leaderboard 引入私密高品質語音資料集，提升 WER 評測可信度

解決 train‑inference mismatch：vLLM V1 後端校正與 RL 目標優化指南

「非同步批次」與 CUDA 串流結合提升 LLM 推論 GPU 效能約 24%

AI 幻覺與供應鏈安全：Slopsquatting 攻擊手法與防禦策略

Lanhu MCP Server 2.0：自動需求分析與 UI 設計支援的開源協作平台

OpenKnowledge：全真 WYSIWYG AI Markdown 編輯器與本地部署 LLM Wiki 解決方案

NeuroLink：以 TypeScript 串流 API 結合多家 LLM、MCP 與 Edge‑first 架構

使用 mcpx 以指令列方式呼叫 MCP 伺服器：安裝與核心指令指南

Auto‑Empirical Research Skills (AERS)：超過 2.3 萬條 Stata AI 代理技能的實證研究資源庫

Learn‑LikeCC：開源逆向 Claude Code 全方位教學平台解析（TypeScript 實作）