執行回饋 - Agents Report

深度分析

隨著1–3B參數的小型語言模型能在本機執行，研究檢視是否透過模型串聯恢復程式碼生成能力。實驗以「生成→執行→精修」的執行回饋循環為核心，並以演化搜尋測試拓樸增益。結果顯示執行回饋大幅修正執行錯誤，複雜管線並未帶來顯著優勢。研究還指出，精修模型能力勝過生成器身分，且必須採用早停避免回歸。