Machine-DevBench - Agents Report

速報

研究指出當前視覺語言模型難以從嬰幼兒與第一人稱影像學到穩定語義。研究以不同語義對齊資料訓練模型並提出以詞彙與語法為核心的Machine-DevBench作為評估。結果顯示模型依賴精準配對資料，無法善用弱對齊自然視角，並提出EgoBabyVLM Challenge以促進改進。