深度分析 Phi-4-mini 4 位元量化實作:從即時串流聊天到 LoRA 微調與 RAG 工作流 本篇教學在 Google Colab 環境下,以 4 位元量化載入 Microsoft Phi-4-mini‑instruct,示範從即時聊天、步驟推理、工具呼叫、檢索增強生成 (RAG) 到 LoRA 輕量微調的完整工作流程。