深度分析 MATE:以轉移嵌入求和記憶在 CMDP 中建立置換不變且高效的表徵 研究針對情境化馬可夫決策問題提出 MATE,使用轉移嵌入的求和聚合作為記憶表徵,保有後驗對轉移順序的置換不變性。此結構迴避 Transformer 的重編成本與 RNN 的梯度與序列更新限制,實驗在多項基準展現具競爭性的表現與運算優勢。具良好泛化與長期記憶能力。