NLCO 基準 - Agents Report

深度分析

隨著大型語言模型在數學推理上展露實力，組合最佳化仍是未被充分測試的領域。研究者推出 NLCO 基準，使用自然語言描述的 43 種組合問題，直接讓模型產出離散解而不需程式碼或外部求解器。實驗發現模型在小規模實例上可保持可行性與解品質，但隨規模擁大效能下降，圖結構與瓶頸目標問題尤為挑戰。