深度分析 Local‑Splitter:七大策略降低雲端大型語言模型程式碼代理的 Token 用量 本研究針對程式碼代理工作負載提出七項減少雲端 LLM Token 用量的策略,包含本機路由、提示壓縮與語意快取等。測試顯示,本機路由結合提示壓縮可節省 45‑79% 的雲端 Token,完整策略組合在檢索增強工作負載中可減少 51% 的 Token,用量。此發現對部署程式碼代理的實務具有指導價值。