深度分析 阿里巴巴 HDPO 框架結合 Metis 代理人:降低工具呼叫至 2% 提升推理精準度 阿里巴巴針對AI代理人過度呼叫工具的問題提出HDPO框架,將正確性與執行效率分離優化。Metis模型在多項視覺與推理基準上創下新紀錄,同時將冗餘工具呼叫率從98%降至2%。此改進提升了回應速度與成本效益。研究者亦透過多階段資料篩選與強化學習,確保模型在不同任務上保持穩定表現。