混合推理 - Agents Report

速報

面對雲端大型語言模型與可離線部署的小型模型的取捨，研究把混合式多代理系統當作中間解。論文將兩種代表性系統改為支援雲端與裝置協作，分析成本、耗能與效能的權衡，發現小型模型可從大型模型協助中獲利，但最佳架構高度依賴任務，更多算力未必帶來更好結果。這為邊緣與雲端協同的設計提供實證洞見。