TempGlitch TempGlitch 基準:VLM 在多幀時序錯誤檢測的實證分析 遊戲畫面瑕疵檢測面臨時序性挑戰;研究提出TempGlitch基準,聚焦五類需跨幀判讀的時序瑕疵,並提供配對無瑕疵影片做二元評估。實驗顯示多款視覺語言模型在此任務接近機率水準,密集取樣或擴模型規模並未穩定改善偵測能力,並測評多款專有與開源模型,結果顯示模型要麼過於保守要麼過度敏感,凸顯時序推理缺口。