Constitutional AI
教宗與Anthropic對話:Constitutional AI、模型可解釋性與人工智慧治理挑戰
教宗在梵蒂岡發表首份聚焦人工智慧的通諭,並邀請Anthropic代表出席說明,形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心,提出Constitutional AI概念,透過原則與規則引導模型行為,強調模型可解釋性與價值內建。
Constitutional AI
教宗在梵蒂岡發表首份聚焦人工智慧的通諭,並邀請Anthropic代表出席說明,形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心,提出Constitutional AI概念,透過原則與規則引導模型行為,強調模型可解釋性與價值內建。
深度分析
當前AI調整以避免危害為主,本文提出「正向調整」概念:不只是阻止錯誤,而是設計能主動促進人類與生態繁榮的系統,透過資料篩選、訓前與訓後策略、評估方法與社群化治理,從消極防禦走向建構性支持。並建議協作價值收集、情境在地化、持續適應與多中心治理等方向,強調在安全之上促進真實性與自主性。
深度分析
當AI部署摩擦大幅下降,能力成長能立刻被放大並嵌入決策流程,治理重心從單一模型行為移向系統性不可逆風險管理。本文引入「決策能量密度」概念,量化節點在單位時間內產生、評估與執行關鍵決策的能力;並提出三項主權邊界:不可逆決策、關鍵資源動員與自我擴張控制。
OpenAI
美國聯邦法院審理的Musk v. Altman 案中,公開的展品包括多封2015年至2017年的電子郵件、公司章程與照片,還原OpenAI早期構想與內部緊張。文件顯示創辦人就非營利定位、治理委員會成員名單、員工薪酬與股權激勵、以及募資承諾等細節展開討論;亦有Nvidia執行長同意提供早期超級電腦的往來。
深度分析
美國北加州法院於2026年展開一場關鍵審判,起因是馬斯克對OpenAI及其創辦人提出的訴訟,指控公司偏離「為人類謀福祉」的創立宗旨,轉而走向利潤導向。訴訟要求撤換執行團隊並取消OpenAI作為公眾利益公司(public benefit corporation)的地位,並提出高額賠償請求。
深度分析
本文重寫人機關係論述,指出當代人工智慧已經超越單純的服從工具,歷經符號主義、統計學、深度學習到基底模型與世界模型等階段,系統愈來愈具備表示、生成與具身行動能力。