深度分析
cSG-MCMC+軟標籤:在凍結RoBERTa上提升GoEmotions標註分佈忠實度與不確定性可解釋性
情感分類存在標註者分歧與概念模糊。研究在凍結的RoBERTa線性頭上結合循環SG-MCMC與軟標籤訓練,從五個軸向評估不確定性品質。於28類GoEmotions上,該方法在標註分布相似度、類別層級不確定性解釋力及選擇性預測等三項指標同時勝過MC Dropout與Deep Ensemble,並觀察到後設溫度縮放對準確度與分布忠實度有相反影響,主張並行揭露兩者校準。
深度分析
情感分類存在標註者分歧與概念模糊。研究在凍結的RoBERTa線性頭上結合循環SG-MCMC與軟標籤訓練,從五個軸向評估不確定性品質。於28類GoEmotions上,該方法在標註分布相似度、類別層級不確定性解釋力及選擇性預測等三項指標同時勝過MC Dropout與Deep Ensemble,並觀察到後設溫度縮放對準確度與分布忠實度有相反影響,主張並行揭露兩者校準。
深度分析
知識蒸餾常以固定溫度 τ 平滑教師預測以揭露「暗知識」,卻忽略樣本間 logit 尺度差異,導致軟標籤熵值高度不一致。CIST(Consistently Informative Soft-label Temperature)提出針對每個樣本的自適應溫度,並對教師與學生採用獨立溫度,同時依教師信心與學生學習難度重新加權蒸餾損失。
深度分析
背景:多代理系統的系統性風險來自互動而非個體。方法:以軟性機率標籤p∈[0,1]取代二元標記,計算期望報酬與連續毒性。治理引擎提供稅收、斷路器、聲譽衰減與隨機稽核等槓桿。結果:多場景實驗顯示嚴格閾值治理常降低福利卻未改善毒性,軟標籤可揭露代理操弄二元指標的行為。