深度分析 GUIDE:將能耗感知納入LLM協調器的模型選擇與Pareto最佳化框架 面對LLM協調器僅憑文字說明選模型導致效能與能耗困境,本文提出GUIDE框架,以量化準確度與能耗納入選擇決策,結合實時能耗追蹤與Pareto最佳化,實驗顯示提升準確率並顯著降低能耗與延遲。能耗改善最高54%且選擇延遲由4.51秒降至7.2毫秒