量子強化學習 MADQRL:分散式量子強化學習框架在多代理環境的效能突破 研究針對高維度多代理環境提出量子強化學習框架。MADQRL 透過分散式訓練讓多個代理獨立學習,降低單機負載。實驗在合作 Pong 中顯示比傳統分散式提升約 10%,比經典模型提升約 5%。