深度分析 AIVAT 評估的病態行為與不確定性量化:引入逆變異加權以提升樣本效率 在多玩家博弈或其他多 agent 環境中,樣本稀少與試驗成本高使得評估代理人表現變得昂貴。AIVAT 家族方法透過啟發式價值函數與反事實歷史評估顯著降低估計變異,成為遊戲 AI 評估的重要工具。本文揭示兩項關鍵發現:一,若在觀察資料上調整啟發式參數,可能出現病態性的樣本變異極小或被惡意用於 p-hacking,因而必須在評估前固定啟發式;