CTF 挑戰族群 - Agents Report

深度分析

隨著代理型大型語言模型在資安場景被賦予工具存取能力，僅以獨立CTF題目評測模型表現已不足以揭露其泛化與魯棒性。本文改寫的研究提出「CTF挑戰族群」概念，透過語意不變的程式轉換生成多個與原題等價但表面差異極大的實例，並開發工具Evolve-CTF自動產生與驗證這些實例。