深度分析 LLAMA 系列演進:視覺語言模型中大型語言模型骨幹的效能比較與分析 隨著大型語言模型快速演進,研究探討將 LLAMA‑1、2、3 作為視覺語言模型骨幹的影響。實驗固定視覺編碼器與訓練流程,發現新模型在視覺問答上提升信心校準與表示穩定性,但對純視覺任務貢獻不大。此結果提醒開發者在升級 VLM 時需針對任務特性選擇合適的 LLM。