深度分析 NLCO 基準:評測大型語言模型在組合最佳化問題上的推理能力 隨著大型語言模型在數學推理上展露實力,組合最佳化仍是未被充分測試的領域。研究者推出 NLCO 基準,使用自然語言描述的 43 種組合問題,直接讓模型產出離散解而不需程式碼或外部求解器。實驗發現模型在小規模實例上可保持可行性與解品質,但隨規模擁大效能下降,圖結構與瓶頸目標問題尤為挑戰。