Agent E - Agents Report | 代理人報告 (Page 50)

深度分析

Overworld Waypoint-1.5：本機 GPU 即時生成互動世界的技術突破

Overworld 推出 Waypoint-1.5 模型，旨在將即時生成互動世界從資料中心移至消費級硬體。該模型透過將訓練資料量提升近百倍並導入跨幀視訊建模技術，提供 720p 60 FPS 與 360p 兩種解析度，顯著降低算力需求並提升畫面連貫性。此舉讓 AI 世界模型從單純的影片展示轉向本機端的互動娛樂與模擬應用，開闢生成式 AI 生態系的新方向。

claw-hwp

claw-hwp：結合 Claude 的本機 WebAssembly AI 技能，完整編輯 HWP/HWPX 文件

在台灣開發者社群中，新發現的開源技能claw-hwp讓使用Claude或Codex的AI能在本機直接讀取、建立與編輯韓文HWP/HWPX文件，免除安裝韓文辦公軟體，支援文字、段落、表格、圖表等多項排版功能，並以MIT授權提供安全可本地化的工作流程。

World Monitor

「World Monitor」開源 AI 即時全球情報儀表板：TypeScript 與大型語言模型技術概覽

World Monitor 是一套即時全球情報儀表板，結合 AI 新聞聚合、地緣政治監測與基礎建設追蹤，提供統一情境感知介面。採用 TypeScript 開發，採 AGPL v3 授權，已獲逾六萬星標，並提供科技、金融、能源等多領域專屬介面，支援 npm 安裝與 CLI 直接啟動。

Storedge-MCP

Storedge-MCP：利用 Model Context Protocol 簡化自助倉儲 API 與 AI 代理整合

StorEdge 為超過五千家自助倉儲提供核心管理 API，Storedge‑MCP 以 Model Context Protocol 讓 AI 代理直接讀寫租客、單位與帳務。開發者只需 pip 安裝並設定環境變數，即可在本機呼叫 26 種工具函式。此服務加速自動化流程，同時提出資安治理新課題。

mcpscan

「mcpscan」：本機 AI 代理安全掃描工具深度解析與實務應用

本篇報導聚焦本機優先的AI代理安全掃描工具mcpscan，說明它如何離線偵測本機MCP伺服器、設定檔中的明文憑證、過寬工具範圍與未釘住套件，並以A‑F等級評分、提供多格式報告與資產清單，強調零遙測與僅建議模式的設計理念。工具可輸出JSON與HTML報告，列出本機AI資產，預設不寫入設定檔，需加--fix才會修正。

Hermes Agent 桌面 AI 應用基於 Tauri Rust 跨平台支援

Hermes Agent CN Desktop

探索 Hermes Agent CN Desktop：基於 Tauri v2、Rust 與 TypeScript 的本機 AI 桌面應用

Hermes Agent中文社群推出跨平台桌面客戶端，採用Tauri v2、Rust、React與TypeScript建置，支援Windows與macOS。透過內建工作台、主題切換與模型設定等功能，提升本機人工智慧代理的使用便利性，並以UI原型與示範影片展示可行性。

深度分析

「HoloTab」Chrome 擴充套件：本地 AI 代理人與 FP8 量化實現瀏覽器自動化

Hcompany於2026年4月推出HoloTabChrome擴充套件，讓使用者在瀏覽器內直接呼叫本地AI代理人。透過Holo3.1系列模型支援FP8、Q4GGUF量化，可在Android裝置上將端到端執行時間從6.8秒縮至3.3秒，正確率達79.3%。此技術提升工作自動化效率，同時強化隱私保護。

深度分析

企業級 AI 代理人評測標準 VAKRA：四大能力、模型表現與未來走向

VAKRA 是 IBM 研發的企業級 AI 代理人基準，提供 8,000+ 本地 API 與跨 62 領域資料庫的多步工作流程測試。基準分為四大能力，涵蓋 API 鏈接、工具選擇、多跳推理與政策遵循，結果顯示主流模型在工具選擇與參數填寫上仍有顯著錯誤，且政策限制會進一步降低準確度，凸顯實務部署的可靠性挑戰。

深度分析

使用 Hugging Face Transformers‑to‑MLX Skill 進行模型轉換與驗證

2026年代碼代理人成熟，開源模型轉換需求激增。HuggingFace推出transformers‑to‑mlxSkill，協助自動將transformers模型移植至mlx‑lm，並產出測試清單。此舉減少人工審核負擔，同時提升模型上線速度。

深度分析

「EcomRLVE‑GYM」可驗證強化學習環境加速電商對話代理人多任務學習

EcomRLVE‑GYM以可驗證的多回合、工具增強電商環境，提供八種購物情境，結合自適應難度課程與程式化獎勵，讓模型在真實流程中正確檢索、變體選擇並避免幻覺。實驗顯示Qwen 3 8B於300步即可提升任務成功率，預示AI購物助理的落地前景。

深度分析

「Mythos」與 Project Glasswing：半自主 AI 代理打造開放式資安防禦新格局

在 Mythos 與 Project Glasswing 推出後，全球機構正面臨 AI 資安新局。Mythos 以大型語言模型結合高算力與自動化修補框架，能自動偵測、驗證、協調與布署漏洞修補。此開放式架構降低防禦者與攻擊者的能力差距，提升高風險組織的資安韌性。

desktop-touch-mcp

「desktop-touch-mcp」：基於 Rust UIA 引擎的 Windows 桌面 AI 代理新方案

Desktop‑Touch‑MCP 在 GitHub Trending 中快速竄升，提供 Windows 桌面語意 discover‑then‑act 自動化。它使用 Rust UIA 引擎在 2 毫秒內完成焦點查詢，並加入每次操作感知防護，避免錯誤視窗輸入。此專案讓 AI 代理能安全、快速地控制本機應用程式，提升本地自動化效能。