- 稳健的手术阶段识别与高效标注监督
手术阶段识别是计算机辅助手术中的一个关键任务,本研究提出了一种能够有效处理缺失阶段标注并减少标注成本的手术阶段识别方法,该方法在两个具有挑战性的数据集上取得了竞争性结果,为手术工作流程识别的进展做出了贡献。
- COLING在预算范围内进行注解:利用地理数据相似性平衡模型性能和注解成本
提出了一种方法来平衡模型性能和注释成本,该方法通过找到与当前大型视觉语言基础模型训练数据集中的对象和行为最不相似的国家的图像来识别待注释的数据,并证明使用这些国家的数据来补充训练数据可以提高模型性能并降低注释成本。
- 大数据驱动的安全自动驾驶中使用主动学习的原因、时间和方法:一项实证研究
在自动驾驶数据集中,采用主动学习策略可以解决数据不平衡、冗余和高维数据的挑战。我们展示了使用信息熵查询来选择信息丰富的样本,旨在降低注释成本和提高模型性能的有效性。我们在 nuScenes 数据集上使用 BEVFusion 模型进行了实验, - AAAI自我监督视觉变换器是不完善标签的高效分割学习器
通过冻结自监督视觉变换器(SSVT)主干并训练轻量级分割头,我们展示了一种成本效益的语义分割方法。通过利用不完美的标签,我们的方法提高了对标签缺陷的鲁棒性,对于各种注释类型,包括涂鸦、点层和图像层标签,在现有方法上展现了显著的性能改进。这项 - 查询策略基准测试:走向未来的深度主动学习
本研究对深度主动学习(DAL)的查询策略进行了基准测试,以减少注释成本。通过开发标准化的实验设置,研究了各种查询策略在六个数据集上的有效性,并使用完全训练的模型进行验证实验,探究了这些方法对这六个数据集的有效性。
- 您需要多少验证标签?探索标签效率模型排序的设计空间
通过使用 LEM 框架,我们在各种选择度量标准的基础上进行了系统研究,证明 LEMR 能够以很小的标注预算达到与完全标注数据集相当的结果,从而在弱监督和半监督学习设置中节约标注成本,并有效地指导大型语言模型的提示选择。
- 基于扰动的主动学习问答
利用主动学习训练策略可以建立一个问题回答模型,以更小的注释成本实现,该策略选择最具信息量的未标记训练数据以有效地更新模型,该研究提出一种基于扰动的主动学习采集策略,并证明其比现有常用策略更有效。
- 稀疏人力监督下的交互多保真度学习,实现经济有效的语言模型适应
我们提出了一种新颖的交互式多保真度学习(IMFL)框架,用于在有限标注预算下以低成本开发小型领域特定的大语言模型,通过平衡低保真度自动标注和高保真度人工标注之间的最佳获取策略,杂质高显学习先进医学和金融任务,在有限的人工标注预算下,IMFL - 深度主动学习在医学图像分析中的综合调查
医学图像分析中,深度学习取得了广泛成功,但标注成本高度制约了深度学习的发展,积极学习旨在选择最具信息量的样本进行标注,并尽可能使用尽量少的标记样本训练高性能模型。本综述对积极学习的核心方法、信息量评估和样本策略等进行了详细回顾,首次对积极学 - 基于认识不确定性的数据选择,将预训练的 ASR 模型适应于低资源临床语音
使用信息不确定性的数据选择方法可以减少成本并提高在稀缺数据情况下非洲口音临床自动语音识别的泛化性能,并优于现有最先进 ASR 模型
- 自动驾驶的标签高效视觉抽象
研究降低语义分割标注成本对行为克隆代理学习的影响,发现利用视觉抽象表示可实现更佳的标注效率和驾驶性能,并发现了其他训练优势。
- ACL减少 BioNLP 注释成本的方法
开发了一种名为 ClosestInitPA 的主动学习算法,特别适用于在训练数据冗余、注释成本高、支持向量机适用的任务和不平衡的数据集(即在构建二元分类问题时,其中一个类别比另一个类别稀少得多)中显著降低 BioNLP 任务的注释成本。