深度分析
Granite 4.0 3B Vision:企業文件多模態模型,精準表格與圖表解析
IBM 推出 Granite 4.0 3B Vision,為企業文件提供視覺語言模型,結合表格抽取、圖表理解與語意鍵值對解析。模型以 LoRA 套用於 Granite 4.0 Micro,透過 ChartNet 合成資料與 DeepStack 架構提升精度。測試顯示在 Chart2Summary、PubTables 等基準均領先。
深度分析
IBM 推出 Granite 4.0 3B Vision,為企業文件提供視覺語言模型,結合表格抽取、圖表理解與語意鍵值對解析。模型以 LoRA 套用於 Granite 4.0 Micro,透過 ChartNet 合成資料與 DeepStack 架構提升精度。測試顯示在 Chart2Summary、PubTables 等基準均領先。
深度分析
IBM推出的Granite4.03BVision為企業文件提供緊湊的視覺語言模型,透過ChartNet合成圖表資料集、DeepStack視覺特徵注入與LoRA模組化設計,提升表格、圖表與鍵值抽取精度,並在多項基準測試中領先同類模型,在企業AI流程中顯著提升效率。
深度分析
IBM 於 2026 年發布 Granite 4.0 3B Vision,針對企業文件的視覺語言理解進行優化。模型利用 ChartNet 圖表資料集與 DeepStack 多層特徵注入,實現高精度的表格抽取、圖表轉換與鍵值對辨識。測試結果顯示,在 Chart2Summary、PubTables‑V2 等基準上均領先同類模型,預計將加速企業文件自動化流程。