- 缓解知识图谱中的关系偏差
提出了一种名为 Fair-KGNN 的知识图谱神经网络框架,可以同时减轻知识图谱中个体偏见和关系偏见的影响,从而实现表示学习的公平性和预测性能。
- KDD通过模型和数据偏差交互理解欺诈检测中的不公平性
机器学习算法应用广泛,但也可能存在偏见和不公平。本研究提出了一种刻画数据偏见的分类法,并探究了算法的不公平和精度之间的权衡。实证研究表明,在不同的数据偏见设置下,算法的公平性和精度会受到不同的影响,而简单的预处理干预技术可以提高算法的公平性 - ACL面向医疗报告生成的基于能力的多模态课程学习
该研究针对医学图像生成任务的特殊性,提出了基于能力的多模态课程学习框架(CMCL),并在公开数据集上进行了实验,证明该框架可用于改善数据偏差和提高现有模型的性能。
- 语言技术从业者作为语言管理者:在 ASR 中仲裁数据偏见和预测偏见
该研究论文采用语言政策视角,分析了当前工业训练和测试自动语音识别系统的做法如何导致数据偏见和算法偏见,进而导致系统误差差异,并提出将语言资源重新构建为(公共)基础设施的建议。
- PatClArC:使用模式概念激活向量进行噪声鲁棒性模型调试
本文介绍了一种名为 PCAV 的模式概念激活向量,用于在潜在空间中实现噪声鲁棒的概念表示,并证明了基于模式的人工建模对 CAVs 的应用具有有益的影响。
- AAAI通过构建反事实和多语言混合进行缩写歧义消除(ADBCMM)
本论文提出了一种名为 ADBCMM 的新方法,通过构建对照实验和多语言混合,可以显著提高低资源语言中的简称消歧性能,通过平衡低资源语言中的数据偏差,ADBCMM 能够改善数据集之外的测试性能,在 SDU@AAAI-22 的共享任务 2:简称 - 自省蒸馏用于稳健问答
本文提出了一种名为 Introspective Distillation(IntroD)的新型去偏差方法,通过内省训练样本是否适合现实 ID 世界或对立 OOO 世界来融合 OOD 和 ID 的归纳偏差,用于解决语言和阅读理解等领域中 QA - 评估图像分类中的偏差
本研究通过使用归因地图的方法,系统性地揭示数据偏差,从而证明了某些归因地图技术比其他技术更好地凸显了数据中的偏差,并且度量可以支持发现偏差。
- ICCV具有随机环境混合的视觉语言导航
本文介绍了一种名为随机环境混合 (Random Environmental Mixup, REM) 的数据增广方法,其通过互换环境中的重要点来生成交叉的房屋场景并产生增广数据,从而帮助代理减少视角偏差的问题,提高了视觉语言导航任务的性能表现 - WWW面向用户的推荐公平性
本文基于用户视角,探讨推荐系统中存在的不公平问题,提出使用重新排序的方法来减轻推荐系统在活跃用户和非活跃用户之间的质量偏差问题,从而提高系统的公平性和整体推荐性能。
- ECCV通过联合生成和分类缓解数据集不平衡
本研究通过组合神经网络分类器和生成对抗网络技术提出了一种联合数据集修复策略,用于解决数据集不平衡所导致的性能下降和数据偏差问题,实验证明这种方法可以提高分类器和生成对抗网络的鲁棒性。
- ICMLPointMask: 面向可解释和偏差鲁棒的点云处理
本研究旨在利用可解释性方法和系统性实验探究在操作点云的深层模型中,如何应对由少量判别性输入变量与目标函数关联所导致的泛化能力下降,提出了 PointMask 方法,该方法通过最小化输入与潜在特征之间的互信息来屏蔽不相关变量,进而在与任意模型 - 统计公平:一种公平分类目标
提出了一种新的公平定义,旨在解决机器学习系统中存在的历史偏见问题,特别是数据偏见。通过为分类问题提供实际的操作策略来证明其有效性和实用性,以消除过去对社会的不利影响。
- FR-Train: 一种基于互信息的公平和鲁棒训练方法
提出了一种名为 FR-Train 的实现公平和鲁棒的模型训练技术,其中的一种新的方法是添加一个附加鉴别器来识别受污染的数据并减少其影响,通过缓解数据偏见和抵御数据污染,实验结果显示 FR-Train 在公平性和准确性方面几乎没有下降,并演示 - 理解图数据集中的同构偏差
本文探讨了关于图形结构数据的分类方法,发现常用的图形分类数据集中存在重复实例,导致同构偏差问题,从而提出了解决方案和开源了新数据集供未来实验使用。
- 生成对抗网络的 “可操控性
该论文研究了生成模型的视觉泛移能力,发现虽然目前的生成对抗网络(GAN)可以很好地拟合标准数据集,但它们仍然没有成为视觉流形的全面模型。同时,研究者还发现这些模型反映了训练数据集的偏差,并提出了一些缓解问题的技术。
- 探究文本蕴涵数据集中的偏见
本研究分析了 SNLI 和 MultiNLI 数据集中逻辑关系的数据偏差程度及其影响,并提出一种简单的方法来降低数据集中的数据偏差。我们发现仅对 SNLI 数据集中的假设进行分类,就能产生 64% 的准确率。
- 推荐系统中的偏差差异
本研究在合成数据上进行了初步的实验研究,在不同条件下研究推荐系统如何表现出偏见失衡现象以及推荐的长期效果。我们考虑了一种简单的重新排名算法来减少偏见失衡,并对实际数据的数据失衡进行了一些观察。
- 端到端位移学习减少偏差:应用于公民科学
本文提出了 Shift Compensation Network (SCN) 的学习方案,可以解决公民科学数据偏见问题, 并应用于公民科学项目 eBird 的鸟类观察数据中。结果表明,SCN 模型可以更好地评估数据分布的偏移并优于不处理数据