- 构建端到端多语言自动歌词转录模型
基于可用数据集,本文旨在创建一个能够进行多语言自动歌词转录的系统,并通过扩展目标词汇集合将已被证明在英语自动歌词转录中有效的技术应用于多语言场景。通过语言分析结合语言分类性能,我们的研究发现多语言模型的性能连续优于仅针对语言子集进行训练的单 - 深度神经网络通过对比自监督学习的进化
我们提出了一个使用自监督学习来进化深度神经网络的框架,通过在 CIFAR-10 数据集上的实验结果表明,我们能够在降低对标注数据依赖的同时进化出适当的神经网络结构,并且相比于采用监督学习的个体,通过自监督学习学习到的网络结构对于输入的标注数 - 重审可微分粒子滤波器的半监督训练目标
本文比较了两种半监督训练目标对可微粒子滤波器的有效性,并在两个模拟环境中展示了标记数据稀缺的结果。
- 关于深度学习技术及其在手写识别中的应用范围的综述
深度学习在手写识别领域的现有研究成果进行了调查,尽管深度学习方法在加快速度和提供准确结果方面取得了显著进展,但根据文献综述,目前的研究发现深度学习仍需解决许多挑战,尤其是在数据标注方面存在问题。然而,手写识别研究预见到深度学习将在图像处理、 - 使用一组上下文敏感模型的图像相似度
基于标注数据的 A:R vs B:R 方法构建了图像相似度模型,并采用集成模型处理稀疏采样和基于上下文数据的偏差,测试结果表明,该集成模型优于单个上下文敏感模型、混合图像数据和现有相似度模型,证明基于上下文标注和模型训练在适当的集成方法下可 - 揭示潜在模式:研究数据集相似性、性能和泛化
通过添加一小部分未见图片到训练集中,我们的方法可以降低训练与注释成本,提高监督式深度学习模型的泛化性能,并在动态环境中对未见数据的模型性能提供估计。
- 学习可迁移的基于对象中心的同胚变换以用于医学图像分割的数据增强
通过学习感兴趣物体的形状变化,提出了一种新颖的物体中心数据增强模型,能够在不修改图像的其余部分的情况下,通过加强感兴趣物体来改善肾脏肿瘤分割的效果。
- 利用对比预训练的主动学习进行面部表情识别
深度学习在面部表情识别方面发挥了重要作用,但标记数据获取需要巨大人力和财力投入,研究发现已有的主动学习方法在面部表情识别上表现不佳,为解决该问题,提出了对比自监督预训练方法,通过两步骤的方法,相较于随机采样提高了 9.2% 的准确度。
- 不要冻结:微调编码器以获得更好的自监督 HAR
本文探讨了自监督学习在人类活动识别领域解决标记数据不足的问题,通过学习预测任务,可以得到有用的表示用于分类,并发现不冻结表示可以在预测任务中实现显著性能提升并且效果与标记数据量成反比。
- 如何提高半隐私学习的效果:PILLAR
该研究提出了一种用于半监督半私有学习的计算方法,通过使用预先在公共数据上训练好的网络特征,能在较低标注的私有数据复杂性的情况下,有效地运行于现实世界数据,并在紧密的隐私约束下享受更好的性能。
- 有效基于提示的关系分类学习
本文提出了一种新的基于提示的学习方法 LabelPrompt,用于关系分类任务,通过定义附加令牌来表示关系标签,并构建提示模板方法,以及设计一个实体感知模块和注意查询策略来解决模型中的一些挑战,极大地提高了在缺乏标注数据情况下利用提示学习的 - EMNLP通过兼容性指导神经实体对齐
通过在实体对齐模型中注入兼容性的性质,我们提出了一种训练框架,以利用在知识图谱中各个实体之间潜在的依赖关系,可用少量标记数据进行训练,却能达到同标准监督训练所得的效果,验证了该技术的优势。
- 基于锚定正则化的集成学习用于无监督方面提取
本文探讨了如何使用来自其他无监督模型的信息来规范 ABAE,以获得更好的性能,既在规则基础的合集方法上得到对比,也证明了对比于单个模型,集成模型的效果更好,而基于规则的集成模型则表现不如基于规范化的集成模型。
- 文本转语音伪标签对于低资源语音识别中的强制对齐和跨语言预训练模型的有效性
本文提出一种对 Maithili、Bhojpuri 和 Dogri 语言创建标签数据的方法,并使用伪标签训练基于 Transformer 的 wav2vec 2.0 ASR 模型。
- Clozer: 适应性数据增强用于填空式阅读理解
本文提出了 Clozer,一种基于序列标注的填空答案提取方法,用于 TAPT 从而提高模型性能,并在多项选择式 MRC 任务上进行了实验,证明 Clozer 在能够独立识别黄金答案的同时,提高了 TAPT 的有效性。
- ICLR主动学习提升弱监督的 WeaSuL 算法
本文介绍了一种新的机器学习辅助标注方法,即 Active WeaSuL。该方法使用专家定义的规则来估算整个数据集的概率标签,并在弱监督模型容易出错的几个点上迭代提供真实标签以优化模型性能。实验证明,Active WeaSuL 比其他方法更适 - 具有群集感知生成模型的半监督生成
本文介绍了 Cluster-aware Generative Model 这一基于深度生成模型的半监督学习方法,利用未标记的数据点探索数据自然聚类模式,同时引入部分带标记的数据对模型进行优化,有效提高了模型性能。该模型也能够在完全无监督的情 - 基于 CNN 的医学图像分割
通过使用三维卷积神经网络结构以及针对标注数据稀少、标注实例失衡和三维医学图像处理困难等问题进行改进与优化,本论文应用于医学图像分割领域,实现了在手部和脑部 MRI 图像上的分割与验证。