CBT-Audio:以語音語言模型量化認知行為治療中病人苦惱
心理治療中的認知行為治療多以口語對話進行。研究提出CBT-Audio資料集,收錄1802次病人發話並驗證轉錄與聲音的差異。使用多個開源語音語言模型比較輸入條件,結果顯示加入語音可提升苦惱評估,且在語句內容與語調不一致時效益最明顯。資料可支持未來模型在心理互動應用的評估。
CBT-Audio:語音補強CBT苦惱評估的盲點
CBT-Audio提出一個以語音為主的評估基準,關注口語表達與文字轉錄之間的差距。資料集包含96則公開認知行為治療錄音中的1,802次病人發話,並在部分資料上由專家驗證轉錄對應的苦惱標註。
研究團隊以10個開源語音語言模型為評測對象,設計三種輸入條件:僅提供病人語音、僅提供文字轉錄、以及同時提供語音與轉錄。評估重點是模型能否依據說話內容與語音訊號判定病人的苦惱程度。
實驗結果指出,語音能提供超出文字的情緒線索,特別在說話內容與語調不一致時更為明顯。於10個模型家族中,有8個在加入語音後的苦惱估計表現優於僅用轉錄,其中4個顯示出統計上顯著的提升。個案分析也表明,當病人口語與字面表述出現落差,語音訊息能協助揭露潛在情緒狀態。
CBT-Audio讓臨床對話中的口語行為可量化,為以語音為基礎的心理互動研究與系統驗證提供測評基準。對台灣科技與醫療圈而言,此類資料集可促進更貼近臨床運作的模型發展,同時提醒研究者在處理敏感語音資料時兼顧倫理與隱私保護。
延伸閱讀
- 大語言模型評估使用者狀態可靠性不足:GPT-4o 與 Gemini 證據揭示風險
- 數位人格與檢索擴充:大型語言模型模擬問卷受訪者的可行性與限制
- 局部校準與貝氏修正:化解隱層統計異質性以提升機器生成文本檢測效能
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。