Consilium Protocol:以認知人格驅動多模型 AI 辯論的新架構
研究團隊提出 Consilium Protocol,一套源自拜占庭容錯的架構,讓多模型 AI 在討論時將模型間的分歧視為認知訊號而非錯誤。透過為語言模型分配工程化的認知人格,並引入量化金融的樣本內/樣本外驗證機制,能區分訓練資料的共識與實證結論。
Consilium Protocol 概述
研究團隊推出 Consilium Protocol,這是一套從拜占庭容錯衍生的架構,專為多模型 AI 辯論設計,將模型間的分歧視為認知訊號而非錯誤。
認知人格與驗證機制
協議為語言模型指派工程化的認知人格,將模型本身與推理方式分離;同時引入樣本內/樣本外驗證框架,借鑒量化金融的做法,區分訓練資料的共識與實證結論。
實驗設計與結果
在 1,478 場辯論、涵蓋 32 個議題、10 個領域的測試中,觀察到以下四點:
- 認知人格而非基礎模型決定認知行為:每批成本 0.0002 美元的自由邊緣推論模型,產出與每批 10.69 美元的前緣模型相當。
- RLHF 對齊訓練產生領域盲點:爭議政策議題的對抗挑戰度比已確定科學議題低 12.3 個百分點,AI 安全議題呈現 11.6% 的非對稱偏差。
- 協議本身未顯示方向性偏向(移民 Δ=2.3%,再生能源 Δ=1.2%)。
- 樣本外證據檢索驗證了 239 項主張,回收率 100%,同時發現 167 個訓練資料辯論中未顯現的盲點。
隨機模型×人格配置的重複性實驗,標準差平均 ±2.2%。完整測試的總成本為 217 美元,協議規範已以 MIT 授權釋出,供外部驗證使用。
延伸閱讀
- MultiTextEdit:跨語系文字圖像編輯的雙軌評估與語言字形忠實度量測
- CSMCIR:以 MCoT 與對稱 Q-Former 結合熵感知記憶庫提升複合影像檢索對齊
- 提示驅動多動物3D重建:SAM 3D Animal 與 SMAL+ 框架
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。