Palette Palette:以參數合併與激活空間搜尋實現模組化授權放寬 面對通用基礎模型一刀切的安全拒絕策略,Palette 提出一套模組化、可控且高效的授權放寬框架。方法透過多目標搜尋辨識拒絕方向,並以輕量化參數內化(weight internalization)把目標域的安全偏好編碼進模型參數,搭配困難樣本挖掘提升邊界案例表現。