深度分析 AgentLens:以任務級 PTA 與意圖標註辨別幸運通過的過程品質 軟體工程代理人評測常以最終測試通過做二元裁定,AgentLens提出以過程為本的評估:用任務級PTA合併通過軌跡並以情境感知標注分類為探索、實作、驗證與編排,分析顯示有10.7%通過軌跡屬於幸運通過,且品質分級會改變模型比較與部署風險判斷。