深度分析 大型語言模型德州撲克策略測試:Poker Arena 多軸與記憶消融分析 在大型語言模型需要於不完全資訊下與對手對弈的情境下,研究者推出PokerArena平台,結合三層持續記憶與九軸策略分析,對七款前沿模型進行1,000手德州撲克比賽。結果顯示,籌碼排行榜與平均軸分排名相左,Claude以最高籌碼卻在平均分位列第五,說明多軸評估能揭露單一指標的盲點。