ARMOR 2025 - Agents Report | 代理人報告

深度分析

面對模型在國防環境可能造成的法律與倫理風險,研究提出ARMOR2025作為軍事對齊的LLM安全基準。該基準以戰事法、交戰規則與聯合倫理規範為基礎,用OODA決策框架分類並設計多選題測試模型在判斷與拒絕上的合規性。評估涵蓋12類別共519題,對21款商業與開源模型揭示明顯對齊缺口。