蒙地卡羅組合規劃(MCPP):在預算與時限下提升代理式工作流程完成率

代理式系統面臨預算與時限約束。提出蒙地卡羅組合規劃(MCPP),用模擬執行並在觀察後重規劃,估計並最大化受限下的工作流程完成機率。規劃涵蓋子任務的模型指派與平行採樣,同時管理剩餘預算與時間,以提升整體完成機率。在多種預算與時限條件下表現更佳。

蒙地卡羅預算時限工作流程概圖

蒙地卡羅組合規劃(MCPP)提升受限工作流程完成率

代理式系統以協調化工作流程分配子任務給不同模型或工具,但實務常有明確預算與截止時間,重點從追求平均效率轉為在給定約束下提升整體成功率。

研究將此問題形式化為有限時域的隨機線上資源分配,執行者需在可同時執行的子任務間指派模型並決定平行採樣數,同時管理剩餘預算與剩餘時間。本文提出蒙地卡羅組合規劃(MCPP),這是一種輕量的閉環規劃器,透過模擬整個工作流程執行來直接估計在預算和時限約束下的完成機率,並在觀察到子任務結果後動態重規劃。

在 CodeFlow 與 ProofFlow 的實驗中,MCPP 在多種預算與時限組合下,持續比強力基線提升受限完成機率。對於需要在有限資源與緊迫時程中提高成功率的真實部署場景,MCPP 提供一條實用的規劃策略。

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more