深度分析 RLScale-Bench 評測:深度強化學習(DRL)與校準後 Kubernetes HPA 在成本與 SLO 上的比較 背景:可調資源控管是雲端部署的重要決策。方法:本文提出RLScale-Bench,統一訓練、架構與評估協議,將六種深度強化學習演算法與經校準的規則式HPA在六種負載與五個隨機種子下比較。結果:發現在成本面HPA普遍最優,惟在突發負載下某些RL可明顯降低SLO違規,凸顯基準校準與報酬工程的重要性。