深度分析 執行回饋優於管線複雜度:1–3B 小型語言模型的程式碼生成實證 隨著1–3B參數的小型語言模型能在本機執行,研究檢視是否透過模型串聯恢復程式碼生成能力。實驗以「生成→執行→精修」的執行回饋循環為核心,並以演化搜尋測試拓樸增益。結果顯示執行回饋大幅修正執行錯誤,複雜管線並未帶來顯著優勢。研究還指出,精修模型能力勝過生成器身分,且必須採用早停避免回歸。