野外科学计算的深度主动学习
提出了一种在科学计算领域中应用的深度主动学习方法,对六个基准问题进行了评估,发现现代池化型主动学习方法都存在一个敏感的超参数,被称为池比例,该方法克服了这一限制,提供了更稳健的性能。
Jan, 2022
深度学习主导的主动学习方法的调查;介绍了 DAL 任务,总结了最重要的基准和常用的数据集;系统地提供了 DAL 方法的分类,包括注释类型、查询策略、深度模型架构、学习范式和训练过程,并客观分析它们的优点和缺点;全面总结了 DAL 在自然语言处理、计算机视觉和数据挖掘等领域的主要应用;在对当前研究进行详细分析后,讨论了挑战和展望。
May, 2024
本研究对 19 种不同的 DAL 方法在统一设置下进行评估,发现大多数 SAL 方法不能比随机选择获得更高的准确度,相较于纯 SAL 方法,半监督训练带来显著的性能提升,尤其是在数据丰富的情况下进行数据选择可以实现显著和一致的性能提升,建议从实践角度早期应用 SSAL,并尽可能收集更多的未标记数据以获得更好的模型性能。
Nov, 2022
该研究结合贝叶斯深度学习与主动学习框架,在高维图像数据的任务中,证明了其在现有主动学习方法上的显着改进。研究表明,结合专业模型,如贝叶斯卷积神经网络,可以使主动学习技术在 MNIST 数据集和皮肤癌诊断任务中得到显著改进。
Mar, 2017
提出一种新的批次模式主动学习算法 —— 判别式主动学习法(DAL),并将其应用在神经网络和大批次查询的情境中,尝试通过将标记集合和未标记的数据池区分开来作为选择样本的依据来执行主动学习,结果表明我们的方法在中等和大批次查询中与最先进的方法相当,并且在实现简单的同时还可以扩展到除分类任务之外的其他领域,同时,我们的实验还表明在相对较大的批次中,当批量大小较大时,当前现有的最先进方法均不比不确定性采样明显更好,从而推翻了一些最近文献中报道的结果。
Jul, 2019
本研究对深度主动学习(DAL)的查询策略进行了基准测试,以减少注释成本。通过开发标准化的实验设置,研究了各种查询策略在六个数据集上的有效性,并使用完全训练的模型进行验证实验,探究了这些方法对这六个数据集的有效性。
Dec, 2023
这篇文章利用自然语言处理技术,针对多个领域的相关研究文献分析了深度学习技术的扩散和影响,在研究健康科学的过程中发现,深度学习技术的采用虽然与知识结构的颠覆和再组合的新颖性呈现负相关,但却能提高期望和引用性能方面的变异性。因此,深度学习方法可以作为一种通用的科学方法,以可衡量的方式推动科学的进展。
Sep, 2020
提出一种基于领域知识的主动学习(KAL)框架,将基于规则的知识转化为逻辑约束,以唤起模型对样本的选择。实验证明,该方法在平均 F1 分数方面优于多种主动学习策略,特别是在领域知识丰富的情况下,同时也适用于物体识别任务,并且计算需求较低。
Oct, 2021