Gemini 2.5 Pro - Agents Report

深度分析

研究利用AlphaEvolve從迭代石頭剪刀布資料自動發掘可解釋程式模型，對比人類與大型語言模型的策略行為。結果顯示先進LLM能更快辨識並利用對手模式，勝率顯著高於人類，同時揭示其對手模型更複雜，而較小模型在長序列推理上表現退步。此發現對未來LLM作為決策輔助工具的安全與效能評估具有重要意義。