深度分析 正交瓶頸:以固定正交投影壓縮強化學習表示 面對深度強化學習中高維表示過剩,研究提出在編碼器後插入固定正交投影的低維瓶頸,將特徵壓縮到同一正交子空間,不需輔助目標或預訓練。理論證明當瓶頸維度超過值函數內在秩時,不會降低表現且保持梯度動力學;實驗在單任務與多任務上常能以極低維度達到或提升基準效能,並穩定化特徵規模與有效秩。