用钟形曲线权重函数改进不确定性采样

Mar, 2024

用钟形曲线权重函数改进不确定性采样

Improving Uncertainty Sampling with Bell Curve Weight Function

Zan-Kai Chong, Hiroyuki Ohsaki, Bok-Min Goi

TL;DR通过使用主动学习方法，借助贝尔曲线采样的新标签，我们提出了一种改进了传统不确定性采样方法的训练模型的方式，该方法对于不同类型的数据集和具有不可预测响应区域的情况下效果良好。

Abstract

Typically, a supervised learning model is trained using passive learning by randomly selecting unlabelled instances to annotate. This approach is effective for learning a model, but can be costly in cases where a

supervised learning passive learning uncertainty sampling bell curve sampling active learning

发现论文，激发创造

理解不确定性抽样

该研究探讨了基于流式学习和基于池式学习的不确定性采样算法，提出了等价损失和损失作为不确定性的概念，建立了不确定性采样算法的泛化界限，并将其与风险敏感目标和分布鲁棒性联系起来，解释了不确定性采样算法在样本规模较小时的优势。

Jul, 2023

图上主动学习中的不确定性

基于节点分类的不确定性采样是主动学习策略，通过迭代地获取具有最高不确定性的数据点的标签，以提高机器学习模型的数据效率。本文首次对节点分类的不确定性采样进行了全面研究，我们超越了预测不确定性来评估不确定性采样，揭示了与其他主动学习策略之间的显著性能差距，并开发了基于数据生成过程的地面真实贝叶斯不确定性估计，证明了其在引导最佳查询中的有效性。在合成数据上验证了我们的结果，并设计了一种近似方法，不断优于其他真实数据集上的不确定性估计。基于此分析，我们将不确定性建模中的问题与现有方法联系起来，我们的分析有助于并引导了基于图的原则性不确定性估计的发展。

May, 2024

不确定性中寻求合适的平衡

利用贝叶斯不确定性估计解决类别不平衡学习的问题，并且成功改进了面部验证、属性预测、数字 / 物体识别、皮肤病检测等六个基准数据集上的分类性能。

Jan, 2019

基于增强树的基于模型不确定性的表格数据主动学习

本研究探讨了基于提升树的主动学习方法对表格数据的有效性，利用模型不确定性进行样本选择，并针对回归任务提出了一种成本效益高的主动学习方法，同时也提出了改进的成本效益高的分类任务的主动学习方法。

Oct, 2023

具有损失不确定性的样本选择及其在带噪声标签学习中的应用

本研究提出了一种无标签学习的新方法，将区间估计引入了样本选择过程，以更好地探索未被充分选择的正确标注但看似贴错标签的较大损失数据和代表性差的数据，提高了误标噪声下的学习鲁棒性。

Jun, 2021

重要性加权主动学习

提供了一个实用的、统计上连贯的方案，可在通用损失函数下主动学习二分类器，该算法使用重要性加权来纠正抽样偏差，并通过控制变量来给出严格的标签复杂性界限，实验表明，该方法减少了实现许多学习问题的良好预测性能所需的标签复杂性。

Dec, 2008

关于主动学习图像分割中的不确定度估计

本文探讨了在数据驱动主动学习框架下，针对医学图像分割任务进行不确定性校准的方法，研究了不同的不确定性估计方法和采集策略，并证明选定区域标注可以显著减少需要人工标注的像素数量。

Jul, 2020

利用不确定性估计来提高分类器性能

模型得分和不确定性对决策边界的选择有关，该研究提供了理论分析和经验证据来证明模型得分估计偏差依赖于不确定性和得分本身，通过动态规划和保序回归算法提出的方案在三个真实数据集上比传统的只使用模型得分方法，在高精确度边界下获得了 25％-40％的召回率提升，凸显了利用不确定性的好处。

Nov, 2023

半监督式人群计数的不确定性校准

半监督式人群计数中，通过使用伪标签和不确定性选择可靠的伪标签来训练模型的一种新方法，该方法通过匹配的基于补丁的代理函数更好地近似了人群计数任务的不确定性，从而生成了可靠的不确定性估计、高质量的伪标签，并达到了最新技术水平。

Aug, 2023

针对长尾半监督学习的不确定性感知采样

基于不确定性感知的动态阈值选择 (UDTS) 方法解决了半监督学习中类别不平衡的问题，通过引入模型预测的不确定性来调整伪标签选择阈值，提高了模型在长尾类别上的准确性。

Jan, 2024