NeurIPS 2025:聯邦學習資料集與公平性基準設計要點
研究針對聯邦學習實驗提出資料集與評測框架。說明資料來源、客戶端取樣、是否含敏感屬性及跨域模擬設定。列出公平性衡量(人口差異、equalized odds、demographic parity)與輸出格式,並提供個別與全域模型的統計與評估流程,利於比較演算法在不同客戶端分布下之效能與公平性表現。
要點速覽
NeurIPS/ArXiv 的設計架構把聯邦學習實驗拆成幾個清楚步驟,目的在於讓資料生成、訓練與公平性評估可複現且可比對。
資料與輸出類型
區分「自然輸出」(可直接用於一般 FL)與「修改後輸出」。選定一個母資料集以生成客戶端層級資料(例如 Income、Employment 類別),並明確說明每個客戶端的取樣策略與資料點範圍。設計時需決定是否包含敏感屬性。
客戶端與跨域設定
規範模擬中要含多少客戶端,並區分 cross-silo 與 cross-device 的模擬方式。cross-device 可進一步按地區或屬性值分割,以反映實務中的資料異質性。
公平性衡量與敏感屬性
列出可選用的公平性指標:人口差異(demographic disparity)、equalized odds、demographic parity 等,並建議先用簡單模型(如邏輯回歸)在原始資料上檢視不公平情況。敏感屬性需明確選擇(例如性別、族群、婚姻狀態),並決定二元或合併處理方式以利比較。
輸出規範與評估
輸出包含每位客戶端的資料統計(資料點數、不公平性指標、效能指標與修改紀錄)、全域模型(FedAvg)在修改前後的整體統計,以及合併後的全域模型表現。資料集與本地模型應以 CSV 與 numpy 格式提供,並附上評估函數以產生按屬性/特徵值的前後比較圖表。
此框架強調清楚記錄每個設計選擇,讓不同研究能在相同基準下比較演算法在效能與公平性上的權衡。
延伸閱讀
- DP‑LAC:以私人直方圖與驗證驅動自適應裁剪實現差分隱私下的聯邦微調
- UMEDA:譜門控 Linear Transformer、Diff‑GNO 與子空間差分隱私的多模態圖形聯邦學習
- HARMONY:以元學習與隱私保護對比對齊,緩解混合分割聯邦學習的表示偏移
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。