A-MBER A-MBER 基準測試:評估大模型跨對話的「情感記憶」與脈絡理解能力 AI 助手若要真正擬人化,必須能理解使用者的情感演變。新發表的 A-MBER 基準測試專注於評估 AI 是否能將長期記憶與當前情感識別結合,要求模型從多場對話歷史中找出關鍵證據來解釋使用者現在的心情,填補了現有情感分析與長文本記憶測試之間的空白。