大型語言模型 - Agents Report

深度分析

大型語言模型在心理健康應用的五軸安全評估框架解析

隨著大型語言模型被廣泛部署為心理健康輔助工具，僅16%相關聊天機器人接受臨床效能測試；研究以250筆延長暴露治療與146筆認知行為重組情境評估模型，發現表層回應雖接近完美，協議遵循度在高嚴重度下僅0.22‑0.33，安全干預分數亦大幅下降。結果顯示現行安全對齊會削弱治療，呼籲以五軸框架評估方可上線。