A-MBER - Agents Report | 代理人報告

A-MBER

AI 助手若要真正擬人化，必須能理解使用者的情感演變。新發表的 A-MBER 基準測試專注於評估 AI 是否能將長期記憶與當前情感識別結合，要求模型從多場對話歷史中找出關鍵證據來解釋使用者現在的心情，填補了現有情感分析與長文本記憶測試之間的空白。