LLM 推論延遲