Neurips2025:面向聯邦學習公平性的數據集與基準框架
ArXiv發表Neurips2025數據集與基準草案,聚焦聯邦學習中的公平性與客戶端差異。採用Income與Employment作為基底,規定客戶端資料生成策略、是否包含敏感屬性與跨裝置/跨筏的客戶分配。評估採多種公平性指標並輸出客戶端與全域模型統計結果,便於比較與複現。
重點一語帶過
ArXiv 提交的 Neurips2025 數據集與基準草案,聚焦建立一套針對聯邦學習公平性與客戶端差異的評估架構。
內容摘要
規範先區分兩種輸出:可直接用於一般聯邦學習的「自然輸出」,以及針對研究需求做出的「修改輸出」。基底資料集可從 ACS 提供的選項擇一生成客戶端資料,草案列出 Income 與 Employment 作為示例來源,並要求說明每個客戶端的抽樣策略(每位客戶端的資料範圍)。
在客戶端範圍設定上,文件涵蓋跨筏(cross-silo)與跨裝置(cross-device)的配置方式,並說明如何依屬性或地理分割客戶端。公平性評估部分指定在簡單模型(例如邏輯迴歸)與原始資料上測量不公平性,列舉多項指標:Demographic disparity、Equalized odds、demographic parity,以及對不同屬性和值的差異性分析。
草案還要求明確列出敏感屬性選項(例如性別、族群等),討論二元或合併群組的處理方式,以及如何報告各客戶端之間的不公平性分布。最終輸出包括每位客戶端的資料統計、各類公平性與效能指標,在修改前後比較的全域模型統計(如 FedAvg 結果)以及可下載的 CSV 檔與本地訓練資料表示。
評估與輸出
評估函數需產生每位客戶端按屬性/特徵值的圖表,比較修改前後的準確度與公平性指標,輸入格式可單位為 numpy 陣列以利重複實驗。
延伸閱讀
- 意向性更新於流式強化學習:以輸出導向步長控制 TD 與策略梯度
- 去噪遞迴模型(DRM)與短窗多步訓練:提升遞迴變壓器的穩定性與推論一致性
- 四軸對齊框架:LongHorizon-Bench 評估長時程企業 AI 代理人的合規與決策衡量
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。