组合覆盖下的主动学习
本文介绍了无线通信中深度学习应用的主动学习算法,通过在无标签数据集中识别关键和信息量最高的样本,仅对这些样本进行标记,从而减少标注开销并保持与传统训练相同的准确性。在深度学习基于毫米波波束选择的案例研究中,我们对多模态数据集进行了不同主动学习算法的性能评估,结果表明,在存在类别不平衡的数据集上,使用主动学习算法可以将标注开销降低 50%。
Jan, 2024
本文介绍了有监督学习中获取标记数据的高成本和获取大量未标记数据的轻松方法,以及通过自适应选择标记样本来获得高精度预测模型的主要问题设置和最近的研究趋势。重点介绍了选择从数据中进行标记的学习获取函数的研究、关于主动学习算法的理论工作和顺序数据获取的停止标准。介绍了材料开发和测量的应用示例。
Dec, 2020
该研究提出了两种新颖的方法来解决主动学习场景中出现的过度自信问题,一种是名为 Cross-Mix-and-Mix(CMaM)的数据扩增策略,旨在通过扩展有限的训练分布来校准模型;另一种是名为 Ranked Margin Sampling(RankedMS)的数据选择策略,以防止选择导致过度自信预测的数据。通过各种实验和分析,我们能够证明我们的提议通过缓解过度自信,促进了有效的数据选择。
Aug, 2023
使用包装器主动学习方法对分类问题进行改进,通过在初始标记样本上构建分类树,将空间分解为低熵区域,再使用基于输入空间的准则从这些区域中进行子采样,并证明了该方法在使用受限标记数据集时构建准确分类模型的有效性。
Apr, 2024
该研究致力于解决减少有标签的训练数据来训练监督式分类模型的问题,通过使用 Active Learning 和 K-means 聚类算法,采用 mini-batch Active Learning 方法来快速有效地选取对模型具有信息量和多样性的训练样例,以达到相当或更好的性能表现。
Jan, 2019
通过覆盖方法,基于深度主动学习的 ProbCover 算法在低预算情况下,利用表征学习和自监督学习的最新进展进行子集选择,从而最大程度地提高了覆盖概率,进而在图像识别基准测试中显示出比现有方法更好的性能,特别是在半监督设置下。
May, 2022
本文研究了主题 “主动学习”,发现尽管在特定模型和特定领域中使用主动学习可能会带来好处,但在不同模型和任务之间泛化当前方法的好处不可靠,并且主动学习的认购数据与指导其获取的模型相结合,与使用独立同分布的(I.I.D)随机样本训练继任模型的方法相比并没有明显的优势,主动学习的局限性是否值得现实中的应用,值得深思。
Jul, 2018