深度分析
Wanda 權重剪枝放大偏見:後訓練壓縮對邊緣 AI 公平性的影響
IoT與邊緣部署促使壓縮LLM以節省資源。本研究用三款指令模型、三種後訓剪枝法與 BBQ 基準量化比較,發現資料感知的 Wanda 剪枝在語言能力接近原模型時,會顯著放大社會偏見;且未結構化剪枝在實務上並未帶來儲存或延遲優勢,顯示僅以 perplexity 驗證不足以保證部署安全。
深度分析
IoT與邊緣部署促使壓縮LLM以節省資源。本研究用三款指令模型、三種後訓剪枝法與 BBQ 基準量化比較,發現資料感知的 Wanda 剪枝在語言能力接近原模型時,會顯著放大社會偏見;且未結構化剪枝在實務上並未帶來儲存或延遲優勢,顯示僅以 perplexity 驗證不足以保證部署安全。
深度分析
研究指出,大型語言模型的低幅權重類似基因組中的垃圾DNA,透過權重剪枝量化其重要性,發現這些看似無用的參數對高難度任務至關重要,剪除會造成不可逆的知識遺失。實驗遍及不同模型規模、任務與資料集,使用非結構與 N:M 結構稀疏化均驗證此假說。結果顯示,對簡單任務可剪除大量小幅權重,然而在高難度任務即使僅削減10%亦會導致顯著性能下降。