深度分析 從 POMDP 生成環節看強化學習分布轉移:統一因果來源分類框架 本研究針對強化學習的分布轉移建立統一因果來源分類,從狀態、觀測、策略、轉移與獎勵五個環節辨識內外部變化,並以顯性、隱性及混合三種時間邊界描述,提供評估框架量化衝擊與恢復,預示AI系統在變動環境中將更依賴因果辨識,此分類亦能對照DCNAR與LSNM‑UV方法,突顯因果結構差異。