速報 Coopetition-Gym v1:混合利害多智能體強化學習基準平台 Coopetition-Gym v1提出一套針對混合利害多智能體強化學習的基準平台。平台包含20個環境與四類機制,並提供可參數化獎勵層以分離收益與獎勵型態,便於消融分析。系統整合126種參考演算法與多種介面,並在四項歷史案例上驗證出高再現度,為連續動作混合動機研究建立可重複評測標準。