深入探究语义规模不平衡

ICLRDec, 2022

Delving into Semantic Scale Imbalance

Yanbiao Ma, Licheng Jiao, Fang Liu, Yuxin Li, Shuyuan Yang...

TL;DR本研究旨在定义和量化类别的语义规模，以测量各个类别的特征多样性，并提出了一种量化语义规模不平衡的方法，设计并实现了基于语义规模平衡的学习方法，在多个数据集上得到了优于传统方法的性能表现。

Abstract

model bias triggered by long-tailed data has been widely studied. However, measure based on the number of samples cannot explicate three phenomena simultaneously: (1) Given enough data, the classification perform

long-tailed data model bias semantic scale class imbalance dynamic re-weighting

发现论文，激发创造

针对长尾语义分割的对数变化平衡

通过引入类别相关的变化，提出了一种在训练阶段使实例不再被投影到特征点而是小范围内的方法，从而在不同类别的特征区域之间实现平衡，提高语义分割的性能和可适用性。

Jun, 2023

语义缩放：使用大型语言模型的贝叶斯理想点估计

本文介绍了一种名为 “语义缩放” 的新方法，用于从文本中进行理想点估计。利用大规模语言模型根据表达的立场对文档进行分类，并提取类似调查的数据。然后使用项目反应理论对这些数据进行尺度化处理。语义缩放显著改进了现有的基于文本的尺度化方法，并允许研究人员明确定义他们所测量的意识形态维度。这是首个在调查工具之外提供此种灵活性的尺度化方法，为难以进行调查的人群开辟了新的研究途径。此外，它适用于不同长度的文档，并生成对大众和精英意识形态的有效估计。作者证明该方法能区分政策偏好和内外群体情感，并根据人类判断在公众中表现出更好的效果。在国会中，它重新捕捉到了第一维 DW-NOMINATE，并在解决构建效度挑战方面具有更大的灵活性。

May, 2024

基于有效样本数的类别平衡损失

研究长尾数据在机器学习任务中的问题，并提出了使用 “有效样本数” 改进重新权重计算的类平衡损失方法来提高对长尾数据集的训练效果。在人工合成的长尾 CIFAR 数据集和大规模数据集 ImageNet 和 iNaturalist 上进行了全面的实验，并证明该方法能够显著提高长尾数据集上的网络表现。

Jan, 2019

探索长尾识别问题中的权重平衡

研究了一种针对长尾数据的方法，基于权重平衡和两阶段训练结合的经典正则化技术，通过分析神经崩溃和锥效应，发现该方法是通过权重衰减和交叉熵损失以及类平衡损失调整的隐式 logit 方法增加特征提取器的 Fisher 判别比率。研究表明，通过将训练阶段的数量减少到一个并提高准确性，可以进一步简化训练方法。

May, 2023

动态度量学习：构建可扩展的度量空间以适应多个语义尺度

该研究介绍了一个新的基本特征 -- 动态范围，并将其应用于深度视觉识别中。同时，提出了动态度量学习的新型任务，旨在学习可扩展的度量空间以适应跨多个语义尺度的视觉概念。该研究还提出了一种方法来缓解不同尺度之间的冲突，并在三个数据集上验证了其有效性。

Mar, 2021

在综合描述符数据集中发现语言模型中的新偏见

本文介绍了一种全新的包含 13 个不同人口统计学轴线近 600 个描述符的、基于 HolisticBias 的更加包容性的偏差测量数据集，结合一组偏差测量模板产生超过 45 万个独特的句子提示，用于探索、识别和减少几个生成模型中的新型偏差。

May, 2022

平衡元 Softmax 用于长尾视觉识别

本文提出了无偏的 Balanced Softmax 方法和 Balanced Meta-Softmax 方法，以解决训练和测试分布不匹配的深度学习分类问题，实验证明其在视觉识别和实例分割任务中胜于现有最佳方法。

Jul, 2020

深度长尾分类进展综述

不均匀数据的深度学习中的挑战及方法研究，重点关注长尾分类问题。

Apr, 2024

公正感知的类别不平衡学习

探索使用长尾学习方法对推特情感和职业分类中的类别不平衡和偏见进行干预，并扩展了基于边际损失的方法以实现公平性。经过受控实验，实证表明所提出的方法有助于缓解类别不平衡和人口统计学偏见。

Sep, 2021

语义分割模型的校准：分析与算法

研究了语义分割校准的问题，提出了一种简单而有效的选择性缩放方法来校准模型，实验结果表明其在多个基准测试中具有卓越的性能。

Dec, 2022