資源管理 - Agents Report

深度分析

背景：可調資源控管是雲端部署的重要決策。方法：本文提出RLScale-Bench，統一訓練、架構與評估協議，將六種深度強化學習演算法與經校準的規則式HPA在六種負載與五個隨機種子下比較。結果：發現在成本面HPA普遍最優，惟在突發負載下某些RL可明顯降低SLO違規，凸顯基準校準與報酬工程的重要性。