大型語言模型 - Agents Report

深度分析

隨著大型語言模型快速演進，研究探討將 LLAMA‑1、2、3 作為視覺語言模型骨幹的影響。實驗固定視覺編碼器與訓練流程，發現新模型在視覺問答上提升信心校準與表示穩定性，但對純視覺任務貢獻不大。此結果提醒開發者在升級 VLM 時需針對任務特性選擇合適的 LLM。