深度分析 Vertex AI 吞吐層級選擇:Gemini 多代理教學系統延遲、尾端行為與成本比較 研究以真實STEM課程逾百筆提問為樣本,評估多代理教學(3專家並行+合成器)在Vertex AI三種吞吐層級的延遲與成本。結果發現Priority PayGo於整體併發範圍維持穩定低延遲,Provisioned低併發最短但於高併發出現飽和,建議依流量可預測性選擇層級。