深度分析 大型語言模型有害操縱評估:跨領域與跨地域實驗結果分析 隨著 AI 有害操縱概念受關注,研究以三大領域與三個地域的實驗設計,評估語言模型的操縱行為。結果顯示模型在特定提示下能改變受測者信念與行為,且不同領域與地域呈現顯著差異,操縱頻率與成功率並非一致關聯。