深度分析 SREGym:以高擬真雲原生故障注入評估 AI SRE 代理人 SREGym 提供一個基於真實雲原生堆疊的即時測試場域,透過可編排的故障與噪音注入器,模擬跨層級的硬體、作業系統、配置與應用錯誤,並支援複合、相關與準穩定失效模式。基準包含九十個實作問題,評測前沿代理人(如 Stratus、Claude Code、Codex)在診斷與緩解上的能力差異。