深度分析 微調 Qwen2.5‑VL‑32B 提升視覺語言模型在網頁互動的成功率 研究以 Qwen2.5-VL-32B 為例,分析其在純視覺輸入的網頁互動挑戰,提出兩階段微調流程,分別判斷游標位置與執行單步指令,最終在單點擊基準測試中將成功率提升至 94%,顯示微調策略對提升模型可靠性具顯著效益。