深度分析 用PTCG-Bench評估LLM代理人:不完全資訊、長期規劃與模組化介面 在寶可夢集換式卡牌遊戲場景下,PTCG‑Bench以完整對局評估LLM代理的策略、長期經驗累積與介面影響。該基準結合不完全資訊推理、長期規劃與文字數值混合推理。實驗顯示代理可達顯著遊戲表現,但自我演化未能穩定提升,且受介面設計左右。值得進一步研究