深度分析 Pocket‑Dentist:緊湊多模態視覺語言模型與LoRA微調在牙科影像的在地推論與效率評測 全球口腔病負擔高且偏遠地區缺診斷資源。研究提出Pocket-Dentist,將三種牙科影像與五類臨床問題統一為多模態問答基準,並納入效率指標與在地推論考量。在iPhone17Pro上微調後之2B模型達到每樣本4.31秒,本地推論兼顧準確與低延遲。