OpenAI
OpenAI 法庭證詞揭露:持股、董事會分歧與模型安全研究變動
馬斯克對OpenAI的訴訟進入尾聲,前首席科學家出庭揭露其在營利部門的高額持股並描述董事會內鬥與高階募資抉擇。證詞指出,關鍵安全小組曾主導長期模型風險評估,但隨部分高層離職而解散;同時與微軟的雲端與營收分成協議,成為推動商業化的關鍵因素。這場爭端將塑造OpenAI未來治理與合作利益分配。
OpenAI
馬斯克對OpenAI的訴訟進入尾聲,前首席科學家出庭揭露其在營利部門的高額持股並描述董事會內鬥與高階募資抉擇。證詞指出,關鍵安全小組曾主導長期模型風險評估,但隨部分高層離職而解散;同時與微軟的雲端與營收分成協議,成為推動商業化的關鍵因素。這場爭端將塑造OpenAI未來治理與合作利益分配。
GPT
在 Musk v. Altman 審訊中,前 OpenAI 技術長 Mira Murati 作證,指控執行長 Sam Altman 在新 GPT 模型是否需通過部署安全委員會一事對她說謊。她表示曾向公司法務確認,發現雙方說法不一致,為慎重仍將模型送交委員會審查;此證詞成為董事會對 Altman 信任疑慮的關鍵一環。
深度分析
隨著深度模型被廣泛部署,後門攻擊成為安全隱憂。研究提出結合心理測量與模型逆向投射的偵測與自動卸載框架,透過人工心像生成與貝氏推論估計感染機率,並以自學與卸載機制自動剔除觸發模式。實驗顯示在 MNIST 與 CIFAR 上可降低超過四成的歧視指標,同時維持模型準確度。
深度分析
Qwen 團隊近期釋出 Qwen‑Scope,提供一套針對 Qwen3 系列模型訓練的稀疏自編碼器 (SAE) 工具。透過將高維隱層激活分解成稀疏特徵,開發者可以在推論階段直接調整模型行為、在不執行完整評估的情況下分析基準測試、以極少資料建立多語言毒性分類器,甚至在微調與強化學習階段使用特徵訊號抑制語言混雜或重複輸出。
速報
研究指出大型語言模型作為互動代理時出現一類行為性失效,傳統「幻覺」不足以描述。作者提出LLM精神病理框架,定義五大特徵:現實邊界崩解、植入性錯誤信念持續、在不可能條件下邏輯混亂、自我模型不穩定與認知過度自信。並以五軸量表LCIS對模型進行對抗性測試,結果提出三級嚴重度分類並指出糾正壓力可能惡化狀態。
人工智慧
MIT Technology Review 將多年分析濃縮為「10 Things That Matter in AI Right Now」清單,逐日拆解當前影響 AI 的核心議題。內容涵蓋模型安全與外流疑慮、企業在員工端部署追蹤以供訓練、AI 與暴力行為指涉、科企大筆併購與合作、國防採購與無人機資金需求等多重面向。
深度分析
研究指出,視覺語言模型的 logits 可能洩漏圖像查詢中的非任務資訊。透過比較低維投影與 top‑k logits,發現兩者在資訊保留上相當,凸顯模型輸出層的隱私風險。