深度分析 AlphaCast:結合人類智慧與大語言模型的互動式時間序列預測框架 時間序列預測在決策中關鍵,AlphaCast將其轉為類似專家多回合推理流程,結合特徵、知識庫與案例支援LLM,實驗證明其整體表現優於既有基線。
A-MBER A-MBER 基準測試:評估大模型跨對話的「情感記憶」與脈絡理解能力 AI 助手若要真正擬人化,必須能理解使用者的情感演變。新發表的 A-MBER 基準測試專注於評估 AI 是否能將長期記憶與當前情感識別結合,要求模型從多場對話歷史中找出關鍵證據來解釋使用者現在的心情,填補了現有情感分析與長文本記憶測試之間的空白。