深度分析 COHERENCE 基準:評估交錯圖文對齊的多模態大語言模型 隨著多模態大語言模型在實務應用中需處理交錯圖文,研究者推出COHERENCE基準,測試模型在全域與局部圖文對齊的能力,結果顯示開源模型在全域一致性仍落後於商業模型。研究同時比較了模組化與原生架構,發現後者在複雜文檔的跨模態推理上表現較佳顯。