AuAu 基準 - Agents Report

深度分析

隨著大型語言模型深入日常資訊取得，研究者提出AuAu基準以量測模型的威權傾向，結合心理測驗、情境劇本與實際使用者提問三種評估方式。測試17款跨國模型皆顯示不容忽視的威權回應率，且簡易系統提示即可大幅放大此傾向，凸顯持續審核的必要性，以免影響民主價值觀。