深度分析 STAGE 基準:從劇本建模到敘事知識圖與長文脈推理評估 電影劇本屬長篇複雜敘事;STAGE提出以劇本為一致故事世界的多任務基準。它結合清理後劇本文本、電影級知識圖與事件摘要,並以四項任務評估模型跨場景推理與角色扮演能力。實驗顯示EDC方法在結構化抽取上表現最穩定,對模型規模擴大則觀察到遞減效益。