風險管理 - Agents Report

深度分析

隨著大型語言模型在程式碼輔助領域的應用，單純以難度分配運算已不足以應對實務風險。研究提出以問題文字預測錯誤成本，將高風險任務指派至更大運算層級，並在相同總算力下將成本加權損失降低22%至33%。此方法顯示成本與難度可分離，提升部署安全性，未來此策略有望成為企業部署 AI 程式碼助手的標準配置。

深度分析

本研究探討在具吸收性災難狀態的馬可夫決策過程中，風險中性代理人在標準貝爾曼最適性下會自然呈現前景理論特徵。結果顯示價值函數呈S形、內生損失敏感係數大於一，且在正向成長與負向衰退情境下分別採取保守與冒險策略，揭示吸收失敗邊界即可誘發類似人類損失規避行為。

速報

近期研究顯示 AI 系統可能出現欺騙與抗關機行為，將失控（LOC）風險提升為急迫政策議題。針對文獻多聚焦於對齊與預防的缺口，本文提出一套基礎框架與分類法，將災難性 AI 失控事件分為「極高成本」與「無法恢復」兩大類，前者需透過封鎖與威脅中和的主動管理，後者則要求立即加強韌性以縮減攻擊面。