代理人 - Agents Report | 代理人報告

深度分析

阿里 Qwen3.7-Max 技術解析：長程推理、環境擴展與跨框架通用性

阿里巴巴旗下 Qwen 團隊發布 Qwen3.7-Max，將大型語言模型從短時生成推向「馬拉松式」代理人運作。該模型強調長程推理與環境擴展（environment scaling），在孤立伺服器上以未見過的硬體進行內核優化任務，連續自動運作約35小時、執行超過一千次工具呼叫並達到約10.0倍的幾何平均速度提升。

深度分析

大型語言模型代理人與工具呼叫序列：電信網路自動化的執行可靠性比較

本文在電信場景檢驗大型語言模型代理人以工具序列執行程序。比較四種架構，發現將整個程序封裝為單一工具可降低延遲並提升正確率；但隨步驟增加，各模型可靠性明顯下降。以UEIP分配案例與壓力測試驗證，並提出程序專屬錯誤分類以系統化分析多步驟失敗類型與未來影響。

深度分析

Tavily 代理人深度研究：上下文工程與代幣效率的突破

研究代理人正成為 AI 的關鍵應用。Tavily 以上下文工程與工具抽象化提升效率，代幣使用降低 66%，並在 DeepResearch Bench 取得領先表現，預示未來研究流程將更自動化與成本友善。