深度分析 大型語言模型代理人與工具呼叫序列:電信網路自動化的執行可靠性比較 本文在電信場景檢驗大型語言模型代理人以工具序列執行程序。比較四種架構,發現將整個程序封裝為單一工具可降低延遲並提升正確率;但隨步驟增加,各模型可靠性明顯下降。以UEIP分配案例與壓力測試驗證,並提出程序專屬錯誤分類以系統化分析多步驟失敗類型與未來影響。