深度分析 STAGE 基準:電影劇本知識圖譜構建、長文問答與角色一致性評測 電影劇本是長篇、多角色且跨場景的敘事載體,對大型語言模型(LLM)維持一致世界模型與長文推理能力構成挑戰。STAGE(Screenplay Text, Agents, Graphs & Evaluation)提出一套統一的多任務基準,將每部劇本視為共享敘事世界,涵蓋電影級知識圖譜構建、場景事件摘要、長文問答與劇內角色扮演四大任務。