強化學習 - Agents Report

深度分析

本研究針對強化學習的分布轉移建立統一因果來源分類，從狀態、觀測、策略、轉移與獎勵五個環節辨識內外部變化，並以顯性、隱性及混合三種時間邊界描述，提供評估框架量化衝擊與恢復，預示AI系統在變動環境中將更依賴因果辨識，此分類亦能對照DCNAR與LSNM‑UV方法，突顯因果結構差異。