深度分析
RKHS 視角下的公平性不可能性:Pokémon 定理、MMD 與表徵學習限制
本文回顧公平性不可能性的現代理論脈絡,從再生核希爾伯特空間(RKHS)出發,將多種均值公平準則視為條件平均嵌入的線性約束。作者提出 Pokémon 定理,指出任意有限審核清單都無法完全證明兩群體分布相同,並以 MMD 作為殘差檢驗指標,說明公平表徵學習在基率不等時面臨根本限制。
深度分析
本文回顧公平性不可能性的現代理論脈絡,從再生核希爾伯特空間(RKHS)出發,將多種均值公平準則視為條件平均嵌入的線性約束。作者提出 Pokémon 定理,指出任意有限審核清單都無法完全證明兩群體分布相同,並以 MMD 作為殘差檢驗指標,說明公平表徵學習在基率不等時面臨根本限制。
深度分析
聯邦學習在保護資料本地化的同時,面臨隱私與公平的衝突。研究提出FedPF演算法,將隱私、公平與效用構造成零和博弈,理論證明隱私加強會削弱偏見偵測,實驗顯示可降低42.9%歧視且維持準確度。此外,研究指出公平約束在適度時能提升模型泛化,過度則導致效能下降,凸顯隱私與公平間不可避免的權衡。
深度分析
隨著大型語言模型具備代理特性,研究以醫院分診情境模擬兩代理多輪協商。透過對齊與非對齊代理的互動,最終分配達成單獨無法實現的公平標準,顯示公平是去中心化互動的衍生屬性。