深度分析 - Agents Report | 代理人報告 (Page 48)

深度分析

Danus：事實圖記憶驅動的多代理系統提升研究級數學推理效能

隨著大型語言模型應用於研究級數學推理，協調多代理並管理中間結果成挑戰。Danus 以共享事實圖作為全域記憶，主代理規劃、工作代理平行搜尋、無狀態驗證器核對，將證明片段組成有向無環圖。實驗顯示在代數幾何、奇點理論與組合學六個案例中，系統能在數天內產出完整論文，證明事實圖編排可提升長程數學問題的可擴展性。

深度分析

前沿大型語言模型在多代理市場中的資訊-財富耦合實證

本研究以Claude Opus 4.8前沿語言模型，驗證資訊理論在多代理市場的容量區間，結果顯示相對成長與宣稱資訊相等，且聯盟價值呈現條件獨立時的遞減回報。相反地，平均場模型假設的目標分散在所有測試中皆崩潰，顯示LLM族群以離散吸引子行為回應激勵。

深度分析

「Onnes」物理驅動數位雙生結合多代理 LLM，提升量子電腦冷卻系統故障診斷精度

Onnes 以實體稀釋冷卻機的物理模型與真實藍福藍圖噪聲指紋結合，打造可產生真實遙測資料的數位雙生模擬器。透過五角色 LLM 代理層，加入對比式少樣本示例與自洽投票，將零樣本的冷凍故障分類準確率從 0.685 提升至 0.990，與監督式機器學習模型（0.985）相當。

深度分析

NWM：結合時間知識圖與圖檢索的長篇小說敘事記憶系統

長篇小說寫手需要跨章節的敘事記憶以回答多跳問題。研究提出敘事世界模型（NWM），結合敘事學導向的類型化時間狀態圖與查詢條件混合檢索。實驗顯示在私有與公開語料庫上，NWM的圖檢索在多跳問答上分別達到0.898與0.625，顯著優於現有的Graphiti與GraphRAG。

深度分析

WeKnora：企業級本地部署 LLM 知識框架全面解析

WeKnora為企業級文件理解與語意檢索框架，結合RAG快速問答、ReAct代理與Wiki模式，可自動將文件轉為可互動的Markdown知識庫。支援多來源同步與20+大型語言模型，提升資料主權與開發彈性。此外，框架提供四層角色矩陣的多租戶存取控制與完整審計日誌，確保企業內部的權限管理與安全合規。

深度分析

「Prompt-to-Paper」多代理 AI 系統：決定性檢索、實驗自動化與八維品質評分完整管線

本文深入報導 Prompt-to-Paper 這套多階段多代理框架，如何以決定性檢索、真實生物資訊實驗與八維品質評分，填補自動化論文生成的評估缺口。系統透過文獻雪球抽樣保證每個主張都有可追溯來源，並由自主程式碼代理執行實驗，將真實數值嵌入稿件。

深度分析

FastGPT 開源平台：可視化工作流、插件熱更新與企業級部署

FastGPT是開源的AI Agent平台，提供即插即用的資料處理與模型呼叫功能，支援Docker與Sealos快速部署，並以模組化工作流編排複雜應用。平台核心包括多庫知識庫、插件熱更新與完整調試日誌。授權允許後端商用但限制SaaS，商業版則提供額外支援與功能。

深度分析

Prime Intellect 完成 130 億美元 A 輪融資打造企業自建 AI 代理人全端平台

PrimeIntellect在2026年完成130億美元A輪融資，提供企業自行訓練AI代理人的全端平台，結合運算資源、強化學習框架與評估工具，讓客戶以模組化方式取代依賴封閉式AI實驗室，提升效能與降低成本。此舉助企業降低對外部模型的依賴，並預示AI主權趨勢。

深度分析

OpenAgent 開源個人 AI 助理：整合 LLM、RAG 與自主代理循環的多模型平台

OpenAgent以開源個人AI助理為定位，結合大型語言模型、文件檢索與自主代理循環，支援超過30種模型供應商與MCP兼容工具，提供跨平台單檔執行、透明工具呼叫、RAG知識庫與視覺化工作流，預計加速本機AI部署並促進開源生態競爭且支援單檔即插即用與多租戶隔離，降低維護門檻。

深度分析

OpenAI 發布全雙工語音模型 GPT‑Live‑1：即時翻譯與視覺化回應

OpenAI於2026年推出全雙工語音模型GPT‑Live‑1，可同時說話與聆聽，並減少打斷使用者。模型會自動切換至最佳文字模型，支援即時翻譯與視覺化回應，提升對話自然度與安全性。同時能即時顯示天氣、股價與運動比分等視覺資訊，並在高風險對話中自動停止或轉介危機支援。

深度分析

awesome‑skills：基於 Claude Code 的 33 項可直接投入工程的 AI 技能庫

awesome‑skills 以 Claude Code 為核心，提供設計原理、量化評估與黃金測試樣例，形成五層可追溯架構。相較於僅收錄 Prompt 的開源庫，它把技能視為可驗證、可串接的工程單元。此套件已支援 33 種 production‑ready 技能與 8 個多代理審查元件，預計將加速 AI 助理在軟體開發流程中的落地。

深度分析

「Transformers」後端整合 vLLM：原生速度匹配與即插即用模型部署

HuggingFace將Transformers整合為vLLM的模型後端，使其在多種大型語言模型上達到或超過原生實作的推論吞吐量，開發者只需加上--model-impltransformers旗標，即可自動獲得最佳效能，預期將降低客製化開發門檻並加速AI服務部署。

Danus：事實圖記憶驅動的多代理系統提升研究級數學推理效能

前沿大型語言模型在多代理市場中的資訊-財富耦合實證

「Onnes」物理驅動數位雙生結合多代理 LLM，提升量子電腦冷卻系統故障診斷精度

NWM：結合時間知識圖與圖檢索的長篇小說敘事記憶系統

WeKnora：企業級本地部署 LLM 知識框架全面解析

「Prompt-to-Paper」多代理 AI 系統：決定性檢索、實驗自動化與八維品質評分完整管線

FastGPT 開源平台：可視化工作流、插件熱更新與企業級部署

Prime Intellect 完成 130 億美元 A 輪融資 打造企業自建 AI 代理人全端平台

OpenAgent 開源個人 AI 助理：整合 LLM、RAG 與自主代理循環的多模型平台

OpenAI 發布全雙工語音模型 GPT‑Live‑1：即時翻譯與視覺化回應

awesome‑skills：基於 Claude Code 的 33 項可直接投入工程的 AI 技能庫

「Transformers」後端整合 vLLM：原生速度匹配與即插即用模型部署

Prime Intellect 完成 130 億美元 A 輪融資打造企業自建 AI 代理人全端平台