深度分析 AuAu 基準:結合心理測驗、情境劇本與實際提問的 LLM 威權傾向評估框架 隨著大型語言模型深入日常資訊取得,研究者提出AuAu基準以量測模型的威權傾向,結合心理測驗、情境劇本與實際使用者提問三種評估方式。測試17款跨國模型皆顯示不容忽視的威權回應率,且簡易系統提示即可大幅放大此傾向,凸顯持續審核的必要性,以免影響民主價值觀。