- 缓解语音模型中的偏见的对比学习方法
使用对比学习技术来减轻语音模型中的偏差,改善性能不佳的子群体的内部表示,从而降低模型偏差并提升性能。
- ACLLLMs 的手术特征空间分解:为什么,何时和如何?
低秩近似在大型语言模型中的应用及其对性能和模型偏差的影响的实证研究。
- 异构和长尾数据上的多层个性化联邦学习
MuPFL 是一种创新的个性化联邦学习框架,通过多层次结构完全利用不同层次的计算资源,解决数据异质性对模型偏差的影响,缓解过拟合、加速训练,提高分类准确性,并在非独立同分布和长尾条件下取得显著的有效性和效率方面的进展。
- 线性后处理的最佳组公平分类器
我们提出了一个后处理算法来进行公平分类,通过统一的族群公平度量准则,包括统计平衡、平等机会和平衡赔率,来减轻模型偏差,适用于多类问题和具有属性感知和属性盲的设置。通过使用 “公平代价” 来重新校准给定基准模型的输出分数,它通过线性组合(预测 - ACL使用领域条件互信息缓解抽象摘要中的虚构现象
通过基于领域条件点间互信息(domain-conditional pointwise mutual information)的解码策略,本研究解决了抽象摘要中存在的幻觉问题(hallucination)以及模型偏差(model bias), - 发现和减轻图像分类器中的多个有偏群体
通过分解图像特征为多个组分并生成自然语言描述,使用 DIM 方法来发现和减轻图像分类器中的多个有偏群体,并揭示模型在 Hard ImageNet 上的失误模式,以理解图像分类器中的模型偏差。
- 减少偏差的少样本递增学习
本研究提出了一种用于解决少样本增量学习中模型偏差问题的新方法,通过激发映射能力、分别进行双特征分类和自优化分类器等步骤,显著减轻了模型偏差问题,并在三个广泛使用的少样本增量学习基准数据集上取得了最先进的性能。
- 分类任务的常识偏见发现与缓解
基于图像描述提取特征聚类的框架,发现数据集中的敏感关联性,通过调整图像采样权重减轻下游模型偏差问题。
- 社交媒体数据选择的生成式去重
使用生成复制技术解决社交媒体数据中存在的冗余问题,提高语言理解性能并节省训练时间。
- AAAI不平衡半监督学习的两次类别偏差校正
通过引入一种名为 TCBC 的新方法,我们解决了传统半监督学习中的两个挑战:训练样本的不平衡分布导致模型偏向某些类别,以及未标记样本的分布未知且可能与已标记样本不同,在训练过程中进一步导致偏向类别的伪标签。我们通过利用参与训练样本的类别分布 - 概念提炼:利用人类中心解释提升模型性能
我们将 CAVs 从事后分析扩展到事前训练,通过使用额外的概念损失进行微调来减少模型偏差。我们还引入了概念蒸馏,使用预训练的知识模型作为教师来创建更丰富的概念。我们展示了概念敏感训练在去偏、分类问题和重建问题中的应用,可以提高模型的可解释性 - 基于注意力的集成汇聚方法用于时间序列预测
我们提出一种使用基于注意力的集成汇聚模型学习权重的方法来减少时间序列预测中模型偏差的常见技术,并在两个时间序列预测问题上进行测试,发现在预测非平稳的 Lorenz '63 方程时,我们的模型具有出色的有效时间,而在预测 COVID-19 的 - 桥梁扩散模型:桥接非英语母语文本到图像的扩散模型与英语社区
使用 “桥接扩散模型”(Bridge Diffusion Model)结构提出了一种新方法,通过一种端到端的方式,同时生成能够准确描绘非英语本地语义的图像和与英语本地文语义兼容的图像,并促进文化互动。在将该方法应用于构建中文本地文语言生成的 - CALM:一个综合评估语言模型偏见的多任务基准
评估语言模型偏见的全面评估基准数据集(CALM)是用于量化与比较语言模型社会人口统计偏见的重要资源,通过整合现有数据集并构建包含 78,400 个样例的 244 个模板的数据集,CALM 数据集更具多样性和可靠性,能更好地评估语言模型的广度 - DBFed: 基于领域独立的去偏差联邦学习框架
为了保护数据隐私并解决联邦学习中的不公平问题,本文提出了一种基于无领域特定语言的去偏差联邦学习框架(DBFed),并通过实验验证其在准确性和公平性等方面的优越性。
- CVPRICON$^2$: 物体检测中可靠的预测不平等性基准测试
本文提出了一种名为 ICON^2 的框架,用于解决计算机视觉系统中对象检测的公平性问题,可以确定潜在的混淆变量与敏感属性之间的相关性,并控制可能的混淆变量以获得更可靠的模型偏差估计。
- ACL数据和模型中的顽固词汇偏见
使用新的统计方法检查模型训练过程中的假相关关系,发现即使使用了优化方法来减少数据中的偏差,训练出的模型中仍存在对标签的偏差,影响了自然语言推理和重复问题检测两个任务的性能。
- 通过权重集成、多样性加权和先验校正实现通用的测试时适应
本文提出了一种名为 ROID 的方法,该方法通过使用确定性和多样性加权、源模型和自适应模型的加权平均以及自适应添加先验校正方案等多项技术手段,解决了在线测试时自适应的问题,以及由于多种因素引起的模型性能下降问题。该方法在多种数据集、模型和场 - ACL以哪些正确的理由来诉求正确?
本文采用人类理性注释,跨越情感分析和常识推理三个数据集,并涵盖男女老少不同族裔人群,探究了模型预测与人类理性对齐的程度,并指出了现存的一些主观性问题。作者发现模型存在偏见,更倾向于与年龄较大或白人注释器的理性对齐。
- CVPR曲率平衡特征流形学习用于长尾分类
通过对深度神经网络中概念流形的几何测量,研究发现曲率失衡会导致模型偏差,进而提出一种曲率正则化方法来平衡概念流形的几何特征,取得了良好的性能改进效果。