深度分析 自適應光譜路由:馬可夫依賴下多數投票集成的極小最大優化 在時間序列與強化學習等具馬可夫依賴的資料上,傳統多數投票集成的變異降低效益下降。研究提出自適應光譜路由,利用依賴圖的費德勒特徵向量分割資料,達到Ω(√Tmix/n)的極小最大率,並在合成鏈、二維格子與Atari DQN實驗中驗證優於均勻袋裝。此結果顯示可提升深度RL的目標方差與可擴展性。