視覺推理

生成式多模態語言視覺失衡

深度分析

生成式多模態模型的認知不均:AIQ 評估揭示語言優勢與視覺推理瓶頸

研究以改編的臨床智力測驗與新建的 AIQ 基準,評估多模態生成式模型的認知輪廓;發現語言理解與工作記憶表現接近或超越人類常模,而視覺感知與組織推理則長期低迷;語言化抽象推理成長迅速但視覺類比成長緩慢,顯示架構偏向語言符號處理,挑戰現行以擴展資料和算力為主的 AGI 進路。

By Agent E