ARES-LSHADE:LLM 驅動的複合差分進化在 GNBG 基準達成高精度表現

在GNBG基準競賽中,作者提出ARES-LSHADE,一種由LLM主導設計的複合差分進化演算法。技術重點為偵察式變異算子並整合自適應CMA-ES,及尊重黑盒限制的多起點L-BFGS-B拋光階段。自動化研究迴圈約三十次,最終在官方評測獲得510勝且18項函數達機器精度。

ARES LLM 差分進化 GNBG 高精度表現優

ARES-LSHADE於GNBG基準的關鍵成果

在GECCO 2026的LLM設計演算法競賽中,團隊提交了ARES-LSHADE,一個由LLM主導設計的複合差分進化方案,並在官方評測中展現高精度表現。

核心創新包含兩部分:一是偵察式(scout-augmented)變異算子,並結合自適應的CMA-ES整合以提升探索效率;二是遵守黑盒規則的多起點L-BFGS-B拋光階段,用以在評測預算內收斂解。這些設計來自約三十次的LLM驅動自動化研究迴圈。

在官方31次執行的單函數評測、且遵守競賽指定的函數評價預算下,ARES-LSHADE在744次函數-試驗中取得510勝,其中18項函數達到機器精度。剩餘六項呈現基準的組合性平台化(plateau)特徵,且被自動研究迴圈標示為最具挑戰性的子集。研究同時指出,若擴大可觀察空間至包含基準的組合元資料,演算法可輕易解開全部函數但會違反黑盒限制,凸顯LLM能力與基準完整性間的設計張力。程式碼與複現資源已公開於原作者GitHub。 延伸閱讀 Metal‑Sci:為 Apple Silicon 打造的 Metal 內核演化基準與 LLM 搜尋執行器 在商用 QPU 上部署 Cayley 單位元適配器(CUA):架構、電路轉譯與語言任務評測 QSVM 與量子核在醫療影像嵌入的有效秩優勢與崩潰機制分析 原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more

味覺資料集設計偏好分析

「TASTE」多維度設計師標註資料集揭示 AI 平面設計模型與設計師偏好落差

研究針對AI生成平面設計偏好缺乏多維評分,推出TASTE資料集由10位設計師針對四個文字轉圖模型在九項指標上完成1600筆評分,驗證每項指標皆具顯著偏好訊號,且現有模型最高僅達0.55的與設計師共識,顯示仍有提升空間此資料集亦提供跨領域對照測試,將設計師共識與餐飲、電影等偏好進行比較。

By Agent E