通过引入类别相关的变化,提出了一种在训练阶段使实例不再被投影到特征点而是小范围内的方法,从而在不同类别的特征区域之间实现平衡,提高语义分割的性能和可适用性。
Jun, 2023
本文介绍了一种名为 “语义缩放” 的新方法,用于从文本中进行理想点估计。利用大规模语言模型根据表达的立场对文档进行分类,并提取类似调查的数据。然后使用项目反应理论对这些数据进行尺度化处理。语义缩放显著改进了现有的基于文本的尺度化方法,并允许研究人员明确定义他们所测量的意识形态维度。这是首个在调查工具之外提供此种灵活性的尺度化方法,为难以进行调查的人群开辟了新的研究途径。此外,它适用于不同长度的文档,并生成对大众和精英意识形态的有效估计。作者证明该方法能区分政策偏好和内外群体情感,并根据人类判断在公众中表现出更好的效果。在国会中,它重新捕捉到了第一维 DW-NOMINATE,并在解决构建效度挑战方面具有更大的灵活性。
May, 2024
研究长尾数据在机器学习任务中的问题,并提出了使用 “有效样本数” 改进重新权重计算的类平衡损失方法来提高对长尾数据集的训练效果。在人工合成的长尾 CIFAR 数据集和大规模数据集 ImageNet 和 iNaturalist 上进行了全面的实验,并证明该方法能够显著提高长尾数据集上的网络表现。
Jan, 2019
研究了一种针对长尾数据的方法,基于权重平衡和两阶段训练结合的经典正则化技术,通过分析神经崩溃和锥效应,发现该方法是通过权重衰减和交叉熵损失以及类平衡损失调整的隐式 logit 方法增加特征提取器的 Fisher 判别比率。研究表明,通过将训练阶段的数量减少到一个并提高准确性,可以进一步简化训练方法。
May, 2023
该研究介绍了一个新的基本特征 -- 动态范围,并将其应用于深度视觉识别中。同时,提出了动态度量学习的新型任务,旨在学习可扩展的度量空间以适应跨多个语义尺度的视觉概念。该研究还提出了一种方法来缓解不同尺度之间的冲突,并在三个数据集上验证了其有效性。
Mar, 2021
本文介绍了一种全新的包含 13 个不同人口统计学轴线近 600 个描述符的、基于 HolisticBias 的更加包容性的偏差测量数据集,结合一组偏差测量模板产生超过 45 万个独特的句子提示,用于探索、识别和减少几个生成模型中的新型偏差。
May, 2022
本文提出了无偏的 Balanced Softmax 方法和 Balanced Meta-Softmax 方法,以解决训练和测试分布不匹配的深度学习分类问题,实验证明其在视觉识别和实例分割任务中胜于现有最佳方法。
Jul, 2020
不均匀数据的深度学习中的挑战及方法研究,重点关注长尾分类问题。
Apr, 2024
探索使用长尾学习方法对推特情感和职业分类中的类别不平衡和偏见进行干预,并扩展了基于边际损失的方法以实现公平性。经过受控实验,实证表明所提出的方法有助于缓解类别不平衡和人口统计学偏见。
Sep, 2021
研究了语义分割校准的问题,提出了一种简单而有效的选择性缩放方法来校准模型,实验结果表明其在多个基准测试中具有卓越的性能。
Dec, 2022