去偏策略

深度分析

LLM作為評判已成為大量評估的主流。本研究比較九種去偏策略，橫跨五款判官模型、三個基準與四類偏差，並以受控資料精確量測偏差大小。研究指出風格偏差占主導地位，判官普遍偏好簡潔但能辨識真實完整性；對部分模型，組合預算與CoT強制能帶來統計顯著的提升。

深度分析

本研究聚焦低資源語言孟加拉語模型的外部性別偏見，建構四套含性別置換的情感、毒性、仇恨與諷刺測試集，提出結合隨機抽樣、對稱KL與交叉熵的RandSymKL去偏策略，實驗顯示此法能顯著降低性別偏差，同時保持分類精度。