深度分析 大型語言模型在自動化決策中的升級行為與鏈式思考微調評估 自動化系統需在執行與升級間抉擇。研究以大型語言模型預測、估計正確機率並比較成本,測試五大領域。結果顯示模型門檻差異大、校準偏差,調整成本與鏈式思考可提升決策穩健性,建議部署前先行評估升級行為。