深度分析 Acceptance Cards:以四項機制診斷建立安全微調稽核標準 研究指出僅憑持出差距縮小來支持安全微調,易被抽樣或受試差異誤導。Acceptance Cards 提出四項稽核(可靠度、語義泛化、機制一致性、跨任務轉移)與可執行包,並以此在 Gemma-2-2B-it 上重評 SafeLoRA,未通過完整標準,強調須回報部署效能代價與缺失證據。