该研究探讨了基于流式学习和基于池式学习的不确定性采样算法,提出了等价损失和损失作为不确定性的概念,建立了不确定性采样算法的泛化界限,并将其与风险敏感目标和分布鲁棒性联系起来,解释了不确定性采样算法在样本规模较小时的优势。
Jul, 2023
基于节点分类的不确定性采样是主动学习策略,通过迭代地获取具有最高不确定性的数据点的标签,以提高机器学习模型的数据效率。本文首次对节点分类的不确定性采样进行了全面研究,我们超越了预测不确定性来评估不确定性采样,揭示了与其他主动学习策略之间的显著性能差距,并开发了基于数据生成过程的地面真实贝叶斯不确定性估计,证明了其在引导最佳查询中的有效性。在合成数据上验证了我们的结果,并设计了一种近似方法,不断优于其他真实数据集上的不确定性估计。基于此分析,我们将不确定性建模中的问题与现有方法联系起来,我们的分析有助于并引导了基于图的原则性不确定性估计的发展。
May, 2024
利用贝叶斯不确定性估计解决类别不平衡学习的问题,并且成功改进了面部验证、属性预测、数字 / 物体识别、皮肤病检测等六个基准数据集上的分类性能。
Jan, 2019
本研究探讨了基于提升树的主动学习方法对表格数据的有效性,利用模型不确定性进行样本选择,并针对回归任务提出了一种成本效益高的主动学习方法,同时也提出了改进的成本效益高的分类任务的主动学习方法。
Oct, 2023
本研究提出了一种无标签学习的新方法,将区间估计引入了样本选择过程,以更好地探索未被充分选择的正确标注但看似贴错标签的较大损失数据和代表性差的数据,提高了误标噪声下的学习鲁棒性。
Jun, 2021
提供了一个实用的、统计上连贯的方案,可在通用损失函数下主动学习二分类器,该算法使用重要性加权来纠正抽样偏差,并通过控制变量来给出严格的标签复杂性界限,实验表明,该方法减少了实现许多学习问题的良好预测性能所需的标签复杂性。
Dec, 2008
本文探讨了在数据驱动主动学习框架下,针对医学图像分割任务进行不确定性校准的方法,研究了不同的不确定性估计方法和采集策略,并证明选定区域标注可以显著减少需要人工标注的像素数量。
Jul, 2020
模型得分和不确定性对决策边界的选择有关,该研究提供了理论分析和经验证据来证明模型得分估计偏差依赖于不确定性和得分本身,通过动态规划和保序回归算法提出的方案在三个真实数据集上比传统的只使用模型得分方法,在高精确度边界下获得了 25%-40%的召回率提升,凸显了利用不确定性的好处。
Nov, 2023
半监督式人群计数中,通过使用伪标签和不确定性选择可靠的伪标签来训练模型的一种新方法,该方法通过匹配的基于补丁的代理函数更好地近似了人群计数任务的不确定性,从而生成了可靠的不确定性估计、高质量的伪标签,并达到了最新技术水平。
Aug, 2023
基于不确定性感知的动态阈值选择 (UDTS) 方法解决了半监督学习中类别不平衡的问题,通过引入模型预测的不确定性来调整伪标签选择阈值,提高了模型在长尾类别上的准确性。
Jan, 2024