人工智慧治理 - Agents Report

深度分析

XAI 研究新方向：從方法導向到「定義‑屬性‑評估‑部署」基礎框架

隨著AI模型解釋需求升高，研究指出XAI多聚焦於開發臨時方法，缺乏明確目標與評估，導致實務應用有限。作者主張先建立定義、屬性與評估框架，再開發工具，預期提升解釋在決策與治理中的實際效用。此趨勢若被廣泛採納，將促使產業重視解釋性標準，提升模型透明度，並可能形成新興的XAI服務市場。

Constitutional AI

教宗與Anthropic對話：Constitutional AI、模型可解釋性與人工智慧治理挑戰

教宗在梵蒂岡發表首份聚焦人工智慧的通諭，並邀請Anthropic代表出席說明，形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心，提出Constitutional AI概念，透過原則與規則引導模型行為，強調模型可解釋性與價值內建。

深度分析

正向調整與大型語言模型：從負向防護到主動促進人類與生態繁榮

當前AI調整以避免危害為主，本文提出「正向調整」概念：不只是阻止錯誤，而是設計能主動促進人類與生態繁榮的系統，透過資料篩選、訓前與訓後策略、評估方法與社群化治理，從消極防禦走向建構性支持。並建議協作價值收集、情境在地化、持續適應與多中心治理等方向，強調在安全之上促進真實性與自主性。

深度分析

以決策能量密度衡量不可逆風險：人工智慧邊界與治理框架

當AI部署摩擦大幅下降，能力成長能立刻被放大並嵌入決策流程，治理重心從單一模型行為移向系統性不可逆風險管理。本文引入「決策能量密度」概念，量化節點在單位時間內產生、評估與執行關鍵決策的能力；並提出三項主權邊界：不可逆決策、關鍵資源動員與自我擴張控制。

OpenAI

OpenAI 2015–2017 年創立與治理細節：使命、資金與超級電腦支援

美國聯邦法院審理的Musk v. Altman 案中，公開的展品包括多封2015年至2017年的電子郵件、公司章程與照片，還原OpenAI早期構想與內部緊張。文件顯示創辦人就非營利定位、治理委員會成員名單、員工薪酬與股權激勵、以及募資承諾等細節展開討論；亦有Nvidia執行長同意提供早期超級電腦的往來。

深度分析

OpenAI治理爭議：馬斯克控訴、公司使命與人工智慧商業化考驗

美國北加州法院於2026年展開一場關鍵審判，起因是馬斯克對OpenAI及其創辦人提出的訴訟，指控公司偏離「為人類謀福祉」的創立宗旨，轉而走向利潤導向。訴訟要求撤換執行團隊並取消OpenAI作為公眾利益公司（public benefit corporation）的地位，並提出高額賠償請求。

深度分析

針對基礎模型與世界模型：有條件互利與嵌入式治理的共存框架

本文重寫人機關係論述，指出當代人工智慧已經超越單純的服從工具，歷經符號主義、統計學、深度學習到基底模型與世界模型等階段，系統愈來愈具備表示、生成與具身行動能力。