ELDER‑SIM:打造長者性格穩定的數位雙生平台
大型語言模型已被用來開發面向長者的對話代理,但性格表現不穩定(personality drift)阻礙長期模擬與介入評估。研究團隊提出 ELDER‑SIM,一個以本地推論為基礎的多角色長者照護對話平台,整合大五人格(OCEAN)特質設定、以 Beck 認知行為治療為基礎的認知概念化圖(CCD),以及以 MySQL 儲存的長期記憶模組。
要點速報
ELDER‑SIM 提供一套針對長者的多角色對話平台,透過結構化認知模型與記憶模組,減少大型語言模型的性格漂移,提升長期模擬可靠度。
方法與架構
平台以 n8n 工作流程和本地 LLM 推論(Ollama/vLLM)實作,整合三大元件:大五人格(OCEAN)特質規格、以 Beck 認知行為療法為本的認知概念化圖(CCD)、以及基於 MySQL 的長期記憶模組。研究對照四種條件:基線、+記憶、+CCD、+LoRA(在 CHARLS 指令對上微調)。
驗證與結果
以心理計量指標評估一致性與角色辨識。整體可靠度介於可接受到極佳(Cronbach’s α 0.70–0.94;ICC 0.85–0.96)。角色辨識準確度從基線 83.3% 逐步提升至 +Memory 88.9%、+CCD 94.4%、+LoRA 97.2%。CCD 帶來最大的一致性增益(平均 α 從 0.702 → 0.892),而 LoRA 則達到最高整體一致性(α 0.940;ICC 0.958)。
意義
研究示範以結構化認知模型與域別微調可有效抑制性格漂移,提供一套可量化的心理計量驗證流程,對於長期精神健康模擬與臨床前的 in silico 評估具有實務意義。
延伸閱讀
- CLD 與系統動力學評測:雲端 API 與在地模型(llama.cpp、mlx_lm)比較
- DESPITE基準評估:以PDDL驗證LLM在機器人規劃的安全與可行性
- OS-BLIND揭露電腦使用代理人(CUAs)的安全盲點
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。