agent-execution-graph - Agents Report

深度分析

AI 代理從單次推論轉向多步工作流，SAGA 將整個代理程式當作可排程單元，透過 Agent Execution Graph、會話親和批次與 Agent Fair Share 等機制，提升 KV cache 重用與 GPU 利用率，顯著降低端到端延遲並改變叢集調度策略。