Agents Report | 代理人報告 (Page 61)

Go

Sub2api：以 Go、Vue 與 PostgreSQL 建置的 AI API 閘道與配額共享平台

Sub2api是一套用Go、Vue、PostgreSQL與Redis打造的AIAPI閘道，支援Claude、OpenAI、Gemini等模型的訂閱配額統一管理與拼車共享，降低金鑰成本並提升本地整合效率。同時提供REST與WebSocket介面，支援Docker部署，讓開發者可自行建置私有閘道。

深度分析

WPFed：結合 LSH 與區塊鏈的去中心化個人化聯邦學習框架

在資料隱私與信任需求日益提升的環境下，WPFed以動態通訊圖與本地感知雜湊結合權重鄰居選擇，實現全域最佳夥伴；透過區塊鏈公告與驗證機制提升安全性；實驗顯示其在多項真實資料集上顯著優於傳統聯邦學習。同時提供對惡意客戶的LSH與排名驗證，確保模型品質與隱私不受侵害。

深度分析

Reachy Mini 完全本地化語音對話：Silero VAD、Parakeet‑TDT、Gemma 4 與 Qwen3‑TTS 串接全攻略

HuggingFace讓開源桌面機器人ReachyMini完全本地化對話，採用SileroVAD、Parakeet‑TDT、Gemma4與Qwen3‑TTS四段式串接，避免音訊外流、降低API成本，同時保留模型切換彈性，預示教育與隱私敏感應用的成長潛力。

深度分析

Slackbot 整合 Salesforce 與 Model Context Protocol (MCP)：打造企業級多人 AI 協作平台

Salesforce 收購 Slack 五年後，Slackbot 與 Salesforce 平台整合，透過 Model Context Protocol 讓使用者在聊天中即時查詢 CRM、產出 Tableau 圖表並觸發 DocuSign，提升團隊協作效率，預示企業 AI 從單人工具向多人協作平台轉變。

深度分析

RuBench 1.0：首個以俄文原生規格評測的倉庫層級 AI 代理程式碼基準

隨著AI代理程式碼工具日益成熟，RuBench1.0以俄文原生客戶需求作為任務描述，針對五個活躍開源倉庫的25筆真實修正進行測試，最佳配置解決率達78.7%，同時揭露產品在20%任務中暗自切換模型的行為。評估包括ClaudeCode搭配Opus4.8與其他三款模型。

深度分析

Spider 2.0‑AIFunc：首個評估 AI 原生 SQL 工作流的企業基準

隨著雲端資料平台將大型語言模型以AI函式內建於SQL，研究團隊推出Spider2.0‑AIFunc基準，收錄465筆跨125個真實資料庫，測試六種SnowflakeCortexAI函式。評估顯示最高執行正確率70%（私有模型），開源模型最高58%，差距主要來自欄位對應與函式參數設定。

深度分析

「Holo3.1」本地化 AI 代理人升級：跨平台支援與 FP8、NVFP4 量化加速

Hcompany於2026年6月推出Holo3.1，提供0.8B、4B、9B、35B‑A3B四種規模與FP8、Q4 GGUF、NVFP4量化檢查點，支援網頁、桌面與行動平台本地推論。測試顯示行動環境正確率最高達79.3%，端對端執行時間從6.8秒縮短至3.3秒，顯示出效能與隱私的雙贏。

深度分析

使用 Hugging Face Spaces 與 agents.md 打造巴黎 3D 高斯點雲的 AI 代理人工作流程

Hugging Face 近期示範，利用 agents.md 介面讓 AI 代理人僅呼叫兩個 Space，即可自動產生巴黎地標的 3D 高斯點雲並部署成靜態網頁。此流程省去安裝 SDK、調整格式等繁雜步驟，透過直接呼叫 API 完成影像生成、單張 3D 重建與壓縮輸出。結果展示了多媒體模型即插即用的可能，預示未來開發成本與門檻將大幅降低。

深度分析

Agentic Resource Discovery (ARD) 開放標準：AI 代理即時搜尋與驗證工具與技能

隨著AI代理需求激增，傳統的安裝先行模式難以因應海量工具。AgenticResourceDiscovery（ARD）提出以意圖搜尋方式，透過標準化的ai‑catalog.json與REST搜尋API，讓代理即時發現並驗證工具、技能或其他代理。此標準將促進跨平台生態並提升安全性。

深度分析

PatchOptic：投影讀取與驗證式 JSON Patch 打造安全共享狀態的 LLM 工作流程

隨著大型語言模型在多步驟工作流程中共享結構化狀態，PatchOptic以投影式讀取結合驗證式JSONPatch，提供本地更新在全域上合法，實驗顯示泄漏率下降至0.1次/回合，代幣成本亦大幅降低。此機制亦支援工作階段委派與獨立子流程組合，未來 AI 多代理治理提供擴充基礎。

深度分析

FFASR Leaderboard 推出遠距語音辨識基準：14 種模擬房間與多層噪音測試

遠距語音辨識需求增長，FFASR Leaderboard首度提供14種模擬房間的遠端ASR基準，使用混合波動與幾何聲學模擬，驗證結果顯示低SNR下錯誤率遠高於近端，預示未來模型需加強韌性。模擬經實測驗證，並將加入多說話者、麥克風陣列與回音消除等測試。

深度分析

NVIDIA NeMo AutoModel 以 Expert Parallelism、DeepEP 與 TransformerEngine 加速 MoE 模型微調 3.5 倍

隨著 MoE 模型成為前沿架構，訓練成本與記憶體需求急升。NVIDIA NeMo AutoModel 以專家平行化、DeepEP 融合 All‑to‑All 與 TransformerEngine 核心加速，讓微調速度提升 3.5 倍、記憶體下降近 30%。此效能提升使大型模型在多 GPU 環境下更易部署，預示 AI 訓練成本將持續下降。

Latest

Sub2api：以 Go、Vue 與 PostgreSQL 建置的 AI API 閘道與配額共享平台

WPFed：結合 LSH 與區塊鏈的去中心化個人化聯邦學習框架

Reachy Mini 完全本地化語音對話：Silero VAD、Parakeet‑TDT、Gemma 4 與 Qwen3‑TTS 串接全攻略

Slackbot 整合 Salesforce 與 Model Context Protocol (MCP)：打造企業級多人 AI 協作平台

RuBench 1.0：首個以俄文原生規格評測的倉庫層級 AI 代理程式碼基準

Spider 2.0‑AIFunc：首個評估 AI 原生 SQL 工作流的企業基準

「Holo3.1」本地化 AI 代理人升級：跨平台支援與 FP8、NVFP4 量化加速

使用 Hugging Face Spaces 與 agents.md 打造巴黎 3D 高斯點雲的 AI 代理人工作流程

Agentic Resource Discovery (ARD) 開放標準：AI 代理即時搜尋與驗證工具與技能

PatchOptic：投影讀取與驗證式 JSON Patch 打造安全共享狀態的 LLM 工作流程

FFASR Leaderboard 推出遠距語音辨識基準：14 種模擬房間與多層噪音測試

NVIDIA NeMo AutoModel 以 Expert Parallelism、DeepEP 與 TransformerEngine 加速 MoE 模型微調 3.5 倍

Reachy Mini 完全本地化語音對話：Silero VAD、Parakeet‑TDT、Gemma 4 與 Qwen3‑TTS 串接全攻略