KD-MARL KD-MARL:透過結構化知識蒸餾實現多代理人強化學習的邊緣設備部署 面對多代理人強化學習(MARL)部署時的運算瓶頸,新研究 KD-MARL 提出一種資源感知知識蒸餾框架,能將複雜的專家策略轉移至輕量級學生模型。在 SMAC 與 MPE 基準測試中,KD-MARL 成功降低高達 28.6 倍的運算成本,且性能保持率超過 90%,讓 AI 協作能真正進入邊緣設備。