深度分析 SafeHarness:全生命週期防護的 LLM 代理安全架構 大型語言模型代理的執行 harness 為攻擊高價值目標。SafeHarness 透過四層防護:輸入過濾、因果驗證、工具權限分離與安全回滾,將不安全行為率降低約 38%,攻擊成功率降低約 42%,同時保留核心任務效能。