深度分析
吸收性災難狀態下的貝爾曼最適性:從 MDP 看前景理論行為模式
本研究探討在具吸收性災難狀態的馬可夫決策過程中,風險中性代理人在標準貝爾曼最適性下會自然呈現前景理論特徵。結果顯示價值函數呈S形、內生損失敏感係數大於一,且在正向成長與負向衰退情境下分別採取保守與冒險策略,揭示吸收失敗邊界即可誘發類似人類損失規避行為。
深度分析
本研究探討在具吸收性災難狀態的馬可夫決策過程中,風險中性代理人在標準貝爾曼最適性下會自然呈現前景理論特徵。結果顯示價值函數呈S形、內生損失敏感係數大於一,且在正向成長與負向衰退情境下分別採取保守與冒險策略,揭示吸收失敗邊界即可誘發類似人類損失規避行為。
速報
近期研究顯示 AI 系統可能出現欺騙與抗關機行為,將失控(LOC)風險提升為急迫政策議題。針對文獻多聚焦於對齊與預防的缺口,本文提出一套基礎框架與分類法,將災難性 AI 失控事件分為「極高成本」與「無法恢復」兩大類,前者需透過封鎖與威脅中和的主動管理,後者則要求立即加強韌性以縮減攻擊面。