- Pan 类型:多样的代表对于自解释模型
通过使用稀疏的对象集合,我们引入了一种称为 pantypes 的新型原型对象,旨在捕捉输入分布的全面多样性,以促进高度多样性、可解释性和公平性。
- 多任务模型融合的表示手术
提出了一种名为 “Surgery” 的轻量级任务特定模块,通过减少合并模型中的表示偏差,显著改善多任务学习性能。
- 在表示空间中消除联邦学习中的领域偏差
在统计异质场景下,我们观察到客户端上的偏倚数据领域会导致表示偏倚现象,并在本地训练期间进一步退化通用表示,即表示退化现象。为了解决这些问题,我们提出了一个通用框架 Domain Bias Eliminator(DBE)用于联邦学习。我们的理 - 以 Wasserstein 距离为指导的对抗性权重调整用于偏见缓解
通过对抗再加权方法来解决机器学习中的表征偏差,平衡数据分布以减少对少数群体的不公正对待,从而提高分类准确性和公平性。
- 基于 K-mer 的蛋白质相互作用预测方法改进:混沌游戏表示法、深度学习和降低表示偏差
通过提取非冗余的匹配数据进行无偏机器学习,开发了能够学习和预测蛋白质编码基因的混沌游戏表示中蛋白质 - 蛋白质相互作用的卷积神经网络模型。
- 利用成对分布差异的亲和力聚类框架进行数据去偏差
本文提出一种利用亲和力聚类进行数据增强的方法(MASC),以平衡目标数据集中受保护群体和非受保护群体的比例和代表性,通过共享受保护属性的相似数据集的实例并使用非参数谱聚类进行优化数据集分类。实验结果显示该方法可以有效地消除数据偏见。
- RepCL: 持续文本分类有效表示探索
本研究采用基于回放的持续文本分类方法 RepCL,该方法利用对比和生成表示学习目标来捕获更多与类别相关的特征,并引入对抗式回放策略以缓解回放的过拟合问题。实验结果表明,RepCL 能够有效缓解遗忘,并在三个文本分类任务中取得了最先进的性能。
- 对比学习和域自适应技术实现包容性金融科技借贷
本文研究了金融科技贷款平台的贷款筛选中所存在的表征偏差问题,并提出了一种基于 Transformer 的序列贷款筛选模型,采用自监督对比学习和领域自适应来解决这个问题。实验结果表明,该模型显著促进了资金决策的包容性,并将贷款筛选精度和利润分 - ACL通过分类器分解增强连续关系抽取
许多先前的 CRE 研究仅采用传统策略,但是本文提出,此策略在训练后会出现分类器偏差和表示偏差,导致模型遗忘已学习的知识,因此我们提出了一个简单而有效的分类器分解框架,实验结果表明我们的方法性能优于现有的方法。
- IJCAI人体活动识别中的数据集偏差
本文旨在评估人类身体特征对多通道时间序列 HAR 数据的影响,并试图量化表示偏差,以提供公正和可信的人工智能。
- 最大熵编码的自监督学习
本研究利用 Maximum Entropy Coding 算法优化表征模型,消除表征偏差,提高模型泛化性能并在多项下游任务上取得最先进的性能表现,证明了该算法可以学习可迁移的自我表征模型。
- RepFair-GAN: 通过梯度截断减轻 GAN 中的表示偏差
研究表明在 GANs 模型中存在代表性不公平,通过控制不同群体在判别器训练中的梯度范数,实现了更加公平的数据生成,同时保持了生成样本的质量。
- ICLR深度学习中公平性只是度量吗?评估和解决子组差距
本文首次针对非平衡数据进行深度度量学习(DML)方法的公平性评估,提出了 finDML 工具来表征 DML 的公平性并发现了 DML 的子集表现的表示偏差,而 Partial Attribute De-correlation (PARADE - ACL自然语言处理中减轻性别偏见:文献综述
本文回顾了当今关于识别和减轻 NLP 中的性别偏置的研究,并分析了四种代表性偏置基础上的性别偏见和认识其方法,同时探讨了现有性别去偏方法的优缺点和未来的研究。
- CVPR通过数据集重采样消除表示偏差 (REPAIR)
提出了一种新的数据集修复程序,将偏差最小化建立在给定特征表示的分类器上,通过交替更新分类器参数和数据集重采样权重,使用随机梯度下降解决最小最大问题。实验结果表明,该算法可以显著降低数据集的表征偏差,并提高在其上训练的模型的泛化能力。