KD-MARL - Agents Report | 代理人報告

KD-MARL

面對多代理人強化學習（MARL）部署時的運算瓶頸，新研究 KD-MARL 提出一種資源感知知識蒸餾框架，能將複雜的專家策略轉移至輕量級學生模型。在 SMAC 與 MPE 基準測試中，KD-MARL 成功降低高達 28.6 倍的運算成本，且性能保持率超過 90%，讓 AI 協作能真正進入邊緣設備。