Jul, 2024

公平表征十年:挑战与机遇

TL;DR公平表示学习(FRL)是一组基于神经网络的广泛技术,旨在学习新的数据表示形式,其中敏感或不需要的信息已被移除。本文回顾了 FRL 的前十年,通过重新审视其理论基础,并在深度学习理论的最新工作中展示了神经网络表示中信息移除的难度,以及通过大规模实验证实了使用自动化机器学习(AutoML)对本来公平表示进行敌对性 “挖掘” 敏感信息的结果,我们的理论和实验分析表明,确定性、非量化的 FRL 方法在移除敏感信息方面存在严重问题,这尤其令人担忧,因为它们乍一看可能是 “公正” 的。