- 大规模弱监督学习用于卫星图像中的道路提取
使用深度学习从卫星图像中自动提取道路是传统手动制图的可行替代方案,本文提出了利用 OpenStreetMap 道路数据作为弱标签和大规模卫星图像进行预训练语义分割模型的方法,并且利用大规模预训练使模型具有更好的泛化能力。
- 从晦涩难懂的手写文档图像中进行弱监督信息提取
本文讨论了采用弱标签数据从手写处方单中提取药名的问题,并提出一种新的方法,并证明该方法比现有的最先进技术方法表现更好。
- Pic2Word: 图片到词语的映射方法以进行零样本图像检索
提出了一种名为 Pic2Word 的方法,该方法可以在没有标记三元组的情况下使用弱标记和未标记的数据集训练出一个具有很好泛化性能的 CIR 模型。
- 一种适用于嘈杂商务电话对话文本的高效实体识别系统
本研究提出了一种有效的方法,使用有噪声的商务电话对话转录本进行训练的命名实体识别 (NER) 模型,使用 LUKE 作为教师模型,使用大量弱标记数据和少量人工标注数据教授一个 smaller DistilBERT-based 学生模型,并在 - EMNLP用弱标注数据学习的低资源命名标记
该研究提出了一种基于弱标注数据的名字标注神经模型,通过使用 Partial-CRFs 等技术,有效地解决了低资源语言或领域中不足的培训数据问题,并在五种低资源语言和细粒度的食品领域上表现出显著的性能和效率改善。
- 家庭环境下大规模弱标注半监督声音事件检测
本文介绍 DCASE 2018 任务 4,重点评估了利用弱标签数据(没有时间边界)进行大规模声音事件检测的系统,挑战在于探索未标记的数据集与小的弱标签训练集结合以提高系统性能。数据来源于 YouTube 家庭环境视频片段,具有环境辅助生活等 - 多实例课程学习用于弱监督目标检测
该研究使用物体分割指导模型正确定位物体,使用 “多示例课程学习” 方法逐渐拓展训练集,获得了比现有方法更好的效果。
- MM基于门卷积神经网络的大规模弱监督音频分类
本文介绍了一种门控卷积神经网络和一种基于时间注意力的定位方法,用于音频分类,并在 DCASE 2017 挑战赛的大规模弱监督声音事件检测任务中获得了第一名。
- GeneGAN:从非配对数据中学习目标转化和属性子空间
本文介绍了一种利用样例图像进行对象转换的模型,该模型可以从两组不配对的图像中学习对象转换,通过生成模型从弱标记的数据中学习分离的属性子空间。该模型在 CelebA 和 Multi-PIE 数据集上进行了实验验证。
- 使用生成对抗网络进行半监督和弱监督语义分割
本文利用大量未标注或弱标注的数据和生成式对抗网络作为背景,提出了一种半监督框架实现语义分割,其中利用推理出的大量虚假图片来强化真实数据的特征聚类;同时,通过提供分类级别信息,提高 GAN 生成图像的质量,进而改善了像素分类,该方法经过在几个 - 使用弱标签数据进行音频事件检测
本文提出使用弱标签数据学习声音事件检测器的框架,并给出两个基于支持向量机和神经网络解决多实例学习的方法,有助于提高数据处理效率和实现完整音频记录描述。
- 自主学习的目标到底是什么?
本研究证明了自适应学习(Self-paced learning)中的求解策略符合最大化最小化算法的实现方法,并发现其中包含的损失函数类似于统计学和机器学习中已知的非凸正则化惩罚(NSPR),如 SCAD、LOG 和 EXP。通过这些发现,揭 - ConceptLearner: 从弱标注的图像集合中发现视觉概念
本研究提出了 ConceptLearner,一种可扩展的方法来从弱标记的图像集合中自动学习并发现视觉概念检测器,并表明 ConceptLearner 能够应用于图像级别的概念识别和图像区域级别的概念检测,并在 SUN 数据库和 Pascal - 弱监督下的视觉模式配置发现
本文提出了一种自动识别目标类别特有的视觉模式的方法,将其作为无监督目标检测的有益配置,从而实现更好的检测结果。
- 凸可扩展的弱标记支持向量机
本文研究了从弱标记数据中学习的问题,提出了一种名为 WellSVM 的新型标签生成策略,可用于解决半监督学习、多实例学习和聚类问题,并在大数据集上具有良好的可扩展性和性能。