深度分析 量子化時間如何改變多代理強化學習:以 DQN、IDQN 與 MAPPO 在《Quantum Frog》的實驗分析 這項研究提出量子青蛙,一款以量子化時間為核心的雙人合作遊戲,並以強化學習分析遊戲激勵結構。研究比較單人、自主雙人與集中式合作訓練,發現量子化時間使「衝刺」成為普遍最優策略,合作訓練能顯著提升聯合成功率並縮短回合長度。研究也指出未協調第二玩家會大幅增加聯合難度。