- 脑电波探幽者:从大脑活动中重构复杂图像
本文研究了如何通过结合 fMRI 神经活动信号、图像和图像语义描述来重建复杂的图像场景,使用深度学习模型,并且通过采用预先训练的视觉 - 语言潜在空间编码 fMRI 信号来解决数据稀缺的问题。
- COLING用跨语言检索方法提升跨语言事实核查
为了解决低资源语言事实核查数据集的缺乏问题,我们提出了一种跨语言检索的事实核查框架,该框架利用我们提出的自监督算法,使用翻译的文章标题来创建训练实例,并在多种语言下实现证据的汇集。在 X-Fact 数据集上,我们的方法在零 - shot 跨 - AAAI低资源情境下的跨语言和跨领域危机分类
研究社交媒体数据在危机事件管理中的应用,旨在通过跨语言和跨领域的标记数据来自动识别与危机事件相关的消息,从而改善多语言危机分类的数据稀缺性问题。
- ECCV在无标注三维环境中学习视觉语言导航
本研究提出通过使用 900 个未标记的 3D 建筑从 HM3D 中自动创建 VLN 数据集,并通过预训练的语言模型对数据集进行微调,从而解决 VLN 方法中的数据稀缺性问题,从而大幅提高 VLN 模型的泛化能力。实验表明该方法在 REVER - ECCV开放集角度下的少样本类增量学习
本文探究 Few-Shot Class-Incremental Learning(FSCIL)这个重要任务及其数据稀缺性的极端条件,并提出了一种称为 Augmented Angular Loss Incremental Classifica - NusaCrowd:印尼语言开放可重复的自然语言处理研究的呼声
本研究旨在探讨印度尼西亚自然语言处理领域的数据稀缺问题,并提出了一种名为 NusaCrowd 的众包方法,通过聚合印尼语系的数据资源来加强该领域的研究。
- 基于度量的小样本图分类
本研究针对数据稀缺度的问题,提出了一种利用距离度量学习方法和基于图表征学习的分类模型的 few-shot 学习方法,同时在嵌入空间中实现了任务驱动嵌入,最后提出了一种基于 MixUp 的在线数据增强技术。
- 利用伪标记数据提高直接语音翻译质量
本文介绍了一种基于 Transformer 神经网络的直接语音翻译技术,利用伪标签和外部数据来提升翻译效果,并在 Fisher 英西测试数据上创造了最好的翻译结果
- 使用自监督预训练和数据增强增强的直接语音翻译
本文讨论了直接语音到语音翻译模型面临的数据稀缺性问题,探索了自监督预训练和数据增强技术来解决此问题,实验表明自监督预训练可以提高模型性能,结合数据增强技术可以进一步提高模型性能。
- CVPRBatchFormer:学习探索样本关系来实现强鲁棒性表示学习
本研究介绍了一个名为 BatchFormer 的批量转换模块,将其应用于每个 mini-batch 的批量维度以隐式地探索样本之间的关系,并在训练期间对不同样本进行协作,以解决数据稀缺性问题,并在多项数据稀缺应用中取得重要进展,包括长尾识别 - 关于幼儿语音识别任务增强的优化元初始化
本文介绍了一种用于解决儿童自动语音识别中数据稀缺问题所采用的基于元学习的模型初始化方法,首先验证了其有效性,然后通过模拟新年龄来提出了任务级别的增强方法,成功改善了学习器过拟合的问题,并达到了相对词错误率 (WER) 的提升率高达 51% - ACL通过自然语言推理的间接监督进行超细实体类型标注
LITE is a natural language inference-based approach for ultra-fine entity typing, addressing the data scarcity issue and - 零 - shot 多语言机器翻译技术应对语音翻译中的数据稀缺
研究了利用多语言文本翻译中零样本翻译技术在语音翻译中的应用,成功地应用数据增强和辅助损失函数技术提升了有限语音翻译数据的效率和准确率。
- 通过寻找平坦极小值克服渐进式少样本学习中的灾难性遗忘
本研究考虑了增量式少样本学习,解决了现有方法中存在的遗忘问题,并提出在原始阶段搜索基础任务的优化解来维持模型的良好性能。实验结果表明,这一方法优于现有状态 - of-the-art 方法,接近近似的最优结果。
- 自然语言处理中的多任务学习:概述
本文综述了多任务学习在自然语言处理领域的应用。在介绍多任务学习的架构和优化方法后,着重讨论了在多个自然语言处理任务上的表现,最后探讨了相关研究方向。
- 面向对话 AI 的预训练语言模型简要调查 ——NLP 的新时代
本文概述了预训练语言模型在对话系统中的应用,目的是讨论这些模型是否能克服对话系统所面临的挑战,以及如何利用它们的架构来克服这些挑战,并探讨了对话系统领域的开放性挑战。
- 跨模态渐进训练的端到端语音翻译
提出了一种基于 Cross Speech-Text(XSTNet)网络的用于语音翻译的端到端模型,采用自监督预训练子网络作为音频编码器、多任务训练目标以及渐进式训练策略,并在 MuST-C En-X 和 LibriSpeech En-Fr - CVPR更多的照片就是你所需要的:半监督学习用于细粒度 基于草图的图像检索
本论文研究了基于细粒度手绘图像检索模型中存在的数据稀缺问题,并介绍了一种新型的半监督框架,可以利用大规模未标记的照片来提升模型表现,其中心设计是一个顺序照片到草图生成模型,并引入了鉴别器和蒸馏损失来提高数据的质量。实验证明,新的半监督模型相 - ACL基于困惑度的少样本事实核查
本文提出了一种利用语言模型的强大迁移学习能力来实现 fact-checking 任务的 few-shot learning 新方法,并通过实验证明了该方法在多个数据集上取得了非常不错的效果,并公开了两个 COVID-19 相关的事实检查数据 - 长尾实例分割的特征增强和采样调整(FASA)
我们提出了一种名为 FASA(Feature Augmentation and Sampling Adaptation)的方法,通过对稀有类别的特征空间进行增强以解决数据稀缺问题,该方法适用于标准或长尾分割框架,并可适用于其他任务,如长尾分