深度分析 ARMOR 2025 評測:以 OODA 與教義條文衡量 LLM 的軍事對齊 面對模型在國防環境可能造成的法律與倫理風險,研究提出ARMOR2025作為軍事對齊的LLM安全基準。該基準以戰事法、交戰規則與聯合倫理規範為基礎,用OODA決策框架分類並設計多選題測試模型在判斷與拒絕上的合規性。評估涵蓋12類別共519題,對21款商業與開源模型揭示明顯對齊缺口。