Harsanyi–Shapley 值在多方隨機遊戲的延伸:HS-S 與 Coco-S 的比較
研究聚焦可轉移效用的多方隨機遊戲,代理可用側付促成個人理性合作。基於Harsanyi–Shapley值提出HS-S與Coco-S兩種延伸:HS-S聚合動態聯盟對立威脅力;Coco-S以逐狀態HS貝爾曼算子固定點定義。兩者在雙人遊戲一致,但超過兩人時可能分歧,並提出可估算的抽樣方法與實驗比較。
快速報導:HS-S 與 Coco-S 在多方隨機遊戲中的關鍵發現
研究指出,當代理能透過側付達成合作時,傳統的 Harsanyi–Shapley 值需延伸到隨機動態場合。
作者提出兩種 HS 型延伸:HS-S 與 Coco-S。HS-S 以動態觀點聚合聯盟對立的威脅力來分配可轉移效用;Coco-S 則以逐狀態的 Harsanyi–Shapley 類貝爾曼算子尋找固定點來定義價值。
在公理層面,研究把 HS 風格的公理套入隨機遊戲,並證明 HS-S 是滿足這組公理的唯一映射。理論上,二人(雙人)隨機遊戲中 HS-S 與 Coco-S 完全一致;但在超過兩人的情況下,兩者可能出現分歧,研究以一個三人反例說明這一點。
此外,作者運用拓撲度理論證明 Coco-S 固定點在雙人遊戲及部分三人兩狀態案例的存在與唯一性,並引入一項稱為「馬可夫一致性」的新公理來區分 Coco-S 與 HS-S。最後,團隊提出帶有有限樣本保證的抽樣估計器,並在多方格子遊戲基準上比較這兩種值導出的策略與側付安排。
延伸閱讀
- TruthMarketTwin:以 LLM 代理與 GPT-4o 模擬電商評價與保固治理
- MolTrust 協議:以 W3C DID 與 Verifiable Credentials 建構去中心化 AI 代理人信任層
- 基礎模型多代理生成追溯:符號編年誌技術與實驗結果分析
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。