- KDD面向鸟类生物声学的深度主动学习
被动声学监测(PAM)在鸟类生物声学中能够以最小干扰自然栖息地的方式实现经济高效、广泛的数据收集。本文概述了一种深度主动学习方法,介绍了关键挑战,并进行了一个小规模的试点研究。
- 基于预测准确度的医学图像分割主动学习
通过引入预测准确率来定义不确定性,我们提出了一种高效的基于预测准确率的主动学习方法(PAAL)用于医学图像分割,在保证采集样本的不确定性和多样性的同时,显著降低了大约 50% 到 80% 的标注成本,具有在临床应用中的重要潜力。
- 适应性指导视频中的检索增强规划器
本文介绍了在教学视频中的过程规划,其中关键问题包括自适应程序、时间关系、注释成本,并提出了检索增强规划器 (RAP) 模型来解决这些挑战。RAP 通过自适应地确定动作的结论、建立外部内存模块以明确从训练视频中检索最相关的状态 - 动作对,并 - GlanceVAD: 探索用于高效标签的视频异常检测的瞥视监督
本文提出了一种名为 “glance annotation” 的新型标注范式,通过在异常事件中添加随机帧来平衡异常检测准确性和标注成本,在 UCF-Crime 和 XD-Violence 两个标准视频异常检测数据集上进行了综合分析和实验验证, - 稠密标签对于点云三维物体检测总是必要的吗?
使用稀疏标注框架和新方法 SS3D++,以较少的注释成本在 KITTI 和 Waymo 数据集上实现了与弱监督和完全监督方法相当甚至更好的三维物体检测性能。
- 多层次视觉引导的弱监督 3D 目标检测
对于弱监督的三维物体检测任务,本文提出了一种框架来研究如何在无需任何三维标签的情况下利用二维和三维领域之间的约束,通过三种视角的视觉数据建立二维和三维领域之间的关联。实验证明,在无需使用任何三维标签的情况下,该方法在 KITTI 数据集上取 - 日本的亚米地表覆盖物绘制
利用深度学习方法,通过低成本的标注方式,首次实现了在日本全国范围内对八个类别的亚米级土地覆盖进行地图绘制,该方法利用了全球亚米级土地覆盖基准数据集 OpenEarthMap 中 U-Net 模型,通过在训练失败区域重新训练模型,总体准确度提 - TCR - 表位结合亲和力预测的成本效益主动学习框架
T 细胞受体(TCR)是适应性免疫系统的关键组成部分,负责通过识别寄主细胞表面上呈现的表位序列来响应威胁。本研究提出了 ActiveTCR,这是一个结合主动学习和 TCR - 表位结合亲和力预测模型的框架,旨在通过减少注释成本来提高性能,并 - 高准确率和节省成本的主动学习 3D WD-UNet 用于气道分割
我们提出了一种新颖的深度主动学习模型 - 3D Wasserstein 鉴别 UNet(WD-UNet),用于减少医学 3D 计算机断层扫描(CT)分割的注释工作量。我们的方法可以嵌入不同的主动学习策略和不同的网络结构,通过使用不确定性度量 - SIGIR为神经排序模型微调标注数据?当前主动学习策略不如随机选择
本文研究了在有限的训练数据和预算下微调基于预训练语言模型的排序器,发现随机选择不同子集的训练数据进行微调时产生的有效性存在巨大的变化,并探究了主动学习策略在降低标注成本方面的有效性
- 基于分类的回归问题的流式主动学习
该研究提出了一种基于回归分类框架的流式主动学习方法,通过将回归问题转化为分类问题,实现了对回归问题的流式主动学习,从而在相同的注释成本下提高了回归准确性。
- ICCV物体不消失:通过单帧物体位置预测的视频物体检测
通过利用连续平滑的运动,我们在三个方面进行了改进:1)通过将对象运动作为额外的监督来源,从静态关键帧中预测对象位置来提高准确性。2)通过仅在少量帧中进行昂贵的特征计算来提高效率。3)通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本 - 低预算主动学习中的小样本偏差调节
本文针对低成本主动学习中小样本偏差问题,提出了一种名为 Firth 偏差降低的正则化方法,通过整合课程学习链技术来自动调整系数以提高主动学习的效率和性能。
- 使用部分标注和自训练的结构预测数据高效主动学习
本文提出了一种基于主动学习的实用方法,利用部分注释来减少结构标签空间的注释成本,并采用自我训练来将当前模型的自动预测作为未注释子结构的伪标签,通过使用错误估计器自适应地确定部分选择比率来解决选择子结构进行注释的挑战,本文在四个结构预测任务中 - 法律文本分类的高效主动学习流程
本研究提出了一种在法律领域内使用主动学习与预训练语言模型的管道,其中利用了三个阶段的未标记数据,通过知识蒸馏引导模型的嵌入到一个语义上有意义的空间,并提出了一种简单而有效的策略找到初始的标记样本,实验表明相比传统方法在数据标注成本上更为高效 - WSSOD: 弱监督和半监督目标检测的新流水线
本文提出了一种弱 / 半监督目标检测框架 (WSSOD),通过在联合数据集上训练代理检测器,进而在弱标注图像上预测伪包围框,提出了弱监督损失 (WSL)、标签注意力和随机伪标签采样策略来放宽当前半监督流程的假设,并为检测管道的有效性带来额外 - 半监督主动学习的实例分割技术及其评估方法
本文提出了一种基于三元组评分预测 (TSP) 的不确定性采样策略和半监督主动学习框架,以减少标注代价并提高实例分割的性能,通过在医学图像数据集上的实验,表明了该方法可以在不影响性能的情况下大幅减少标注代价。
- COLING基于预训练语言模型的句子匹配主动学习
本文提出了一种基于预训练语言模型的主动学习方法,应用于句子匹配,通过提供语言标准来测量实例并选择更有效的实例进行注释,实验证明该方法可以在更少的标记训练实例的情况下实现更高的准确性。
- 基于图策略网络的图可迁移主动学习
通过强化学习训练一种基于图神经网络 (GNN) 的策略网络,来学习如何高效地标注图中的节点,以减少 GNN 训练的标注成本。该研究还证明了所学习的策略网络在同一领域和不同领域的图之间进行迁移学习的有效性。
- 正确我吧:从错误纠正和标记中学习
该论文通过研究 TED 演讲的翻译数据,提出使用错误标记的标注模式可以更加高效地训练神经机器翻译模型,同时保证较高的信号强度和良好的标注代价。