深度分析 EvalVerse:結合製片管線與思考鏈(CoT)的視覺語言模型評測框架 隨著生成影片基礎模型朝電影級合成邁進,評測成為關鍵瓶頸。EvalVerse 提出一套以製片流程為架構的評測分類法,並透過專家大規模標註與人機校準,把電影美學與專業判準注入視覺語言模型,讓機器在評分前產出可解讀的 Chain-of-Thought 推理。