Constitutional AI
教宗與Anthropic對話:Constitutional AI、模型可解釋性與人工智慧治理挑戰
教宗在梵蒂岡發表首份聚焦人工智慧的通諭,並邀請Anthropic代表出席說明,形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心,提出Constitutional AI概念,透過原則與規則引導模型行為,強調模型可解釋性與價值內建。
Constitutional AI
教宗在梵蒂岡發表首份聚焦人工智慧的通諭,並邀請Anthropic代表出席說明,形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心,提出Constitutional AI概念,透過原則與規則引導模型行為,強調模型可解釋性與價值內建。
深度分析
隨著大型語言模型透過RLHF與ConstitutionalAI對齊,回應中出現大量重複式語句──所謂口語慣性。研究針對八款前沿模型建立Verbal Tic Index,測試千萬次對話頻率與自然度關聯。結果顯示Gemini3.1Pro VTI 0.590,語言自然度最低,凸顯當前對齊方式的『對齊稅』問題。