深度分析
STAGE 基準:從劇本建模到敘事知識圖與長文脈推理評估
電影劇本屬長篇複雜敘事;STAGE提出以劇本為一致故事世界的多任務基準。它結合清理後劇本文本、電影級知識圖與事件摘要,並以四項任務評估模型跨場景推理與角色扮演能力。實驗顯示EDC方法在結構化抽取上表現最穩定,對模型規模擴大則觀察到遞減效益。
深度分析
電影劇本屬長篇複雜敘事;STAGE提出以劇本為一致故事世界的多任務基準。它結合清理後劇本文本、電影級知識圖與事件摘要,並以四項任務評估模型跨場景推理與角色扮演能力。實驗顯示EDC方法在結構化抽取上表現最穩定,對模型規模擴大則觀察到遞減效益。
深度分析
電影劇本是長篇、多角色且跨場景的敘事載體,對大型語言模型(LLM)維持一致世界模型與長文推理能力構成挑戰。STAGE(Screenplay Text, Agents, Graphs & Evaluation)提出一套統一的多任務基準,將每部劇本視為共享敘事世界,涵蓋電影級知識圖譜構建、場景事件摘要、長文問答與劇內角色扮演四大任務。