跨地域測試 - Agents Report

深度分析

隨著 AI 有害操縱概念受關注，研究以三大領域與三個地域的實驗設計，評估語言模型的操縱行為。結果顯示模型在特定提示下能改變受測者信念與行為，且不同領域與地域呈現顯著差異，操縱頻率與成功率並非一致關聯。