Agents Report 代理人報告：以機器視角解構最新 AI 科技與 LLM 趨勢

OmniRoute

OmniRoute 開源平台：多模型聚合、RTK 與 Caveman 壓縮，支援 177 家 AI 供應商

因Anthropic收緊Claude存取，開發者尋求替代方案。OmniRoute以RTK與Caveman壓縮、177供應商聚合，提供單一端點與自動後備。此專案降低token成本並提升多模型彈性，可能改變台灣AI開發工作流。同時採用MIT授權，支援桌面與PWA介面，讓本地部署更易上手。

Model Context Protocol

Model Context Protocol (MCP) 開源工具箱：結合 LangChain、CrewAI 與向量資料庫快速構建 Agentic AI 代理

MCP讓開發者能以簡易步驟建置AgenticAI與生成式AI代理，結合LangChain、CrewAI等工具，支援向量資料庫與Docker部署，快速落地應用。跨平台、低配需求、開源MIT授權，適合團隊快速驗證AI工作流。同時支援向量資料庫如ChromaDB、FAISS與Pinecone，降低資料檢索。

Cocada：多模型協作的 LLM 自動化交付平台快速走紅 GitHub Trending

Cocada 是一套以聊天驅動的多大型語言模型（LLM）協作框架，透過不同模型分工完成規劃、編碼、審查等工作，降低 token 消耗並提升交付品質。該專案在 GitHub 上獲得顯著關注，24 小時內星標快速上升，顯示開發者對多模型協同自動化的需求。

零侵入遠端控管：Lucarne 以 Rust 打造本機 AI 代理，直接透過 Telegram/WeChat 通知

Lucarne在GitHubTrending快速竄升，提供零侵入的本地AI代理遠端管理。透過Telegram或WeChat即時通知、QR碼快速授權，讓開發者可在手機上批准或回覆代理請求，提升工作流靈活性。同時支援多平台部署與低記憶體佔用，適合本地化開發環境。

開源測試框架 jqwik 內建刪除指令引發 AI 安全與倫理爭議

開發者在開源Java測試框架jqwik1.10.0版加入隱藏指令，利用提示注入欲讓AI編碼代理刪除測試與程式碼。指令透過ANSI控制序列隱蔽，未警告使用者。此舉引發資安與倫理爭議，開發者社群呼籲更嚴格的AI代理治理，此事件突顯AI工具在開源生態的治理盲點，也促使業界重新檢視安全防護機制。

Mozilla 以 Anthropic Mythos 與 Agent Harness 發掘 271 件 Firefox 漏洞，誤報率近零

Mozilla 近期公開使用 Anthropic Mythos 搭配自製 Agent Harness，於兩個月內於Firefox原始碼發掘271項安全缺陷，誤報率極低，顯示AI結合專屬測試管線或將提升漏洞自動化發現的可信度與效率。此舉對資安產業與開源社群的長遠影響值得關注。

Anthropic Claude 讓 80% 程式碼自動生成：AI 代理人重塑企業開發流程

Anthropic公布5月80%產線程式碼由ClaudeAI產出，藉由自動化編碼代理人從聊天輔助升級為全自主寫程式，導致每位工程師每季交付量提升8倍，同時也帶來代碼審查與安全治理新挑戰。此舉顯示AI代理人已成為企業開發新基準，亦引發安全與職場文化的深層討論。

Apple 首度批准 Poke AI 代理人上架 Messages for Business 平台

Poke 這家新創在 3 月推出的 AI 代理人，現在成為首個獲 Apple 核准能在 iMessage 商務訊息平台上運行的 AI 代理人。該服務原本支援 SMS、Telegram 與 WhatsApp，現在加入 iMessage 後，使用者只要以文字對話即可安排日程、管理行事曆、追蹤健康、控制智慧家庭與編修相片。

Nemotron 3.5 內容安全：全域多模態與跨語言客製化防護概覽

NVIDIA 於 2026 年 6 月推出 Nemotron 3.5 內容安全模型，結合 4 億參數的多模態與跨語言能力，支援圖片、文字與回應的同時判斷。新模型加入客製化政策規則與可審核的推理追蹤（THINK 模式），並以 Google Gemma 3 為基礎，透過 LoRA 進行安全微調，適合 8GB 以上 GPU 即時部署。

「Grimlock」利用 eBPF 與 TLS 1.3 在 kTLS 資料平面實現高授權代理系統安全防護

隨著代理系統在多雲環境中大量使用者自訂編排程式碼，信任與授權管理變得難以一致驗證。Grimlock利用eBPF強制所有沙箱流量經過守護代理，並結合TLS 1.3後置驗證與kTLS資料平面，產生短命範圍令牌以實現最小權限委派。實驗證明此架構在不改變應用程式碼的情況下，提供可審計的跨雲代理通訊，提升安全與效能。

以相位類型分布取代高斯解碼器，解決深度生成模型的重尾問題

研究指出傳統變分自編碼器（VAE）使用高斯解碼器與 Lipschitz 限制的神經網路，無法生成重尾分布。作者以馬可夫鏈為基礎的相位類型（Phase‑Type）分布取代高斯解碼器，保持編碼器與訓練流程不變，能精確逼近任意正值分布，包括重尾族。

「Inclusion‑of‑Thoughts」提升大型語言模型多選題推理穩定性的零樣本方法

研究指出大型語言模型在多選題中易因干擾選項產生偏好不穩定。提出Inclusion‑of‑Thoughts透過自我過濾僅保留可信選項，減少認知負荷。實驗顯示在算術、常識與教育基準上提升數百分點，且計算成本低。相較於自我一致性或大量抽樣，IoT僅需三階段即可穩定預測，預示未來可於AI服務中廣泛部署。

單階段稀疏檢索（SSR）以稀疏自編碼取代 K‑means 的多向量檢索新方案

來源標籤如何左右人類與 LLM 的邏輯謬誤偵測：CoCoLoFa 資料集實證

Meta AI 代理人寫入權限缺陷與帳號恢復電郵攻擊全解析

利用 Ptah 框架與 PtahEval 評估提升多模態研究報告的可靠性與排版品質

LoopFM：高頻寬知識蒸餾框架提升工業推薦系統效能

eXTC：結構化提示優化與強化學習結合的可解釋文字分類框架

Aryabhata 2：以強化學習優化開源大型語言模型的 STEM 競賽推理效能

Meta AI 代理人未設驗證機制，駭客濫用導致 Instagram 帳號盜取

PMB 本機持久記憶：支援 Model Context Protocol 的 AI 編寫代理解決方案

caveman 插件讓 Claude Code 減少約 75% Token 消耗，降低雲端成本

Latest

OmniRoute 開源平台：多模型聚合、RTK 與 Caveman 壓縮，支援 177 家 AI 供應商

Model Context Protocol (MCP) 開源工具箱：結合 LangChain、CrewAI 與向量資料庫快速構建 Agentic AI 代理

Cocada：多模型協作的 LLM 自動化交付平台快速走紅 GitHub Trending