深度分析 後驗決定式 POMDP:可近似計算可達性值的理論與演算法 部分可觀察馬可夫決策過程面臨可計算性瓶頸。本文提出後驗決定式POMDP這一類別,定義為下一狀態由當前狀態、行動與觀測唯一決定,並以此構造可任意精度逼近可達性值的算法。研究結果顯示此類POMDP的到達概率可被近似評估。此結果擴大了已知可近似求解的POMDP範圍,對驗證與控制合成有實務意義。