深度分析 大型語言模型在心理健康應用的五軸安全評估框架解析 隨著大型語言模型被廣泛部署為心理健康輔助工具,僅16%相關聊天機器人接受臨床效能測試;研究以250筆延長暴露治療與146筆認知行為重組情境評估模型,發現表層回應雖接近完美,協議遵循度在高嚴重度下僅0.22‑0.33,安全干預分數亦大幅下降。結果顯示現行安全對齊會削弱治療,呼籲以五軸框架評估方可上線。