深度分析
阿里 Qwen3.7-Max 技術解析:長程推理、環境擴展與跨框架通用性
阿里巴巴旗下 Qwen 團隊發布 Qwen3.7-Max,將大型語言模型從短時生成推向「馬拉松式」代理人運作。該模型強調長程推理與環境擴展(environment scaling),在孤立伺服器上以未見過的硬體進行內核優化任務,連續自動運作約35小時、執行超過一千次工具呼叫並達到約10.0倍的幾何平均速度提升。
深度分析
阿里巴巴旗下 Qwen 團隊發布 Qwen3.7-Max,將大型語言模型從短時生成推向「馬拉松式」代理人運作。該模型強調長程推理與環境擴展(environment scaling),在孤立伺服器上以未見過的硬體進行內核優化任務,連續自動運作約35小時、執行超過一千次工具呼叫並達到約10.0倍的幾何平均速度提升。
深度分析
本文在電信場景檢驗大型語言模型代理人以工具序列執行程序。比較四種架構,發現將整個程序封裝為單一工具可降低延遲並提升正確率;但隨步驟增加,各模型可靠性明顯下降。以UEIP分配案例與壓力測試驗證,並提出程序專屬錯誤分類以系統化分析多步驟失敗類型與未來影響。
深度分析
研究代理人正成為 AI 的關鍵應用。Tavily 以上下文工程與工具抽象化提升效率,代幣使用降低 66%,並在 DeepResearch Bench 取得領先表現,預示未來研究流程將更自動化與成本友善。