深度分析 布林任務代數新突破:僅學兩基礎任務即可實現零樣本任務組合 在強化學習中,布林任務代數(BTA)提供零樣本任務組合框架。研究發現於確定性MDP下,所有最佳延伸Q函數僅由全域任務與空任務決定,因而可只學兩個基礎任務並以目標集合進行邏輯運算。實驗證實此方法大幅減少學習與組合成本,且在隨機環境中仍需考慮指數級策略與策略多樣性。