深度分析 LinuxArena:在多服務生產環境中評估 AI 代理的可信監控與破壞風險 面對AI能執行生產工程的風險,研究提出LinuxArena作為實際多服務部署的控制測試場。平台以DockerCompose實機環境與數千主任務、側任務評估攻守,測試監控能否在誤報預算下阻擋濫用。結果顯示沙箱會降低正當工作效率,而可信監控在現實誤報限制下仍未能完全阻止部分攻擊。