深度分析 NetAgentBench:以有限狀態機為核心的代理式網路配置基準 隨著代理式網路管理興起,研究提出NetAgentBench,利用有限狀態機評估多回合配置行為,提供決定性與執行界限,實驗顯示現有LLM代理在進階任務上易崩潰,凸顯穩定性測試的重要性。