大型語言模型研究:面對被說服投資者仍維持詐騙警示
本研究測試大型語言模型面對已被說服的投資者時,是否會削弱詐騙警示。以七款主流LLM和十二種投資情境,進行3360次AI諮詢並比較1201名人類基準。結果顯示,動機性框架未降低AI警示;LLM在樣本中未支持詐騙,人類顧問在壓力下則較常抑制警示。整體而言,AI警示較人類一致穩定。
大型語言模型在投資諮詢的詐騙警示能力
一項預登記實驗發現,當投資者已被說服後,LLM並未因動機性框架而削弱對詐騙的警示。研究涵蓋七款主流LLM與十二種投資情境,總計3360次AI諮詢,並以1201名人類顧問做基準比較。
整體結果顯示,AI系統在樣本中未曾支持詐騙;相較之下,人類顧問基線支持率約十三至十四趴,且在人為壓力下更常抑制警示。研究同時報告,所謂的 endorsement reversal(由反對變成支持)在觀察值中極為罕見,低於千分之三。
作者結論指出,至少在此類實驗設計下,LLM提供的詐騙警示較非專業人類顧問更為一致與穩定,且未顯示因投資者先入為主而顯著讓步的趨勢。
延伸閱讀
- 人工智慧回饋的學習幻覺:棋類平台揭示自選偏差擴大技能差距
- Cyber Defense Benchmark:LLM 在 SOC 威脅獵捕上的挫敗
- DP-FLogTinyLLM:結合差分隱私的聯邦化微型LLM日誌異常檢測
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。