- 印地语作为第二语言:利用语义相似的样本改进基于视觉的语音
本研究旨在从多语言角度探讨视觉引导语音模型(VGS)的学习。研究发现,将高资源语言的知识转化为低资源语言的知识可以提高跨模态检索任务中低资源语言的性能,对此,文章提出了两种方法:(1)使用强大的预训练高资源语言编码器和(2)使用语义相似的口 - 面向低资源语言的数据高效语音合成无监督预训练
本文提出了一种基于无监督预训练的神经文本朗读生成模型,通过学习 Warped Mel-Spectrogram 的重构来优化时序关系,进一步提高数据利用效率,在低资源语言情境下实现了显著的性能提升。
- MoLE: 用于多语言自动语音识别的语言专家混合模型
本文提出了一种名为 Mixture-of-Language-Expert(MoLE)的多语言语音识别网络,它可以在任意语言的输入语音中分析语言表达并激活轻量级语言标记令牌工具来估计其激活的可靠性,然后根据语言特定专家的激活和语言不可知专家进 - 利用短语对注入和语料过滤改进机器翻译
本论文表明,短语注入和语料库过滤的组合提高了神经机器翻译 (NMT) 系统的性能。我们从伪平行语料库中提取并增广平行短语和句子,以此训练 NMT 模型。在 Hindi-Marathi、English-Marathi 和 English-Pa - 基于领域感知和跨语义特化的词嵌入 —— 用于社交媒体中的中国性别歧视检测
本文提出了一种跨语言领域感知语义专业化系统,利用高资源语言(英语)的语义资源来专业化低资源语言(中文)的已预训练词向量,从而实现社交媒体中低资源语言性别歧视检测。通过内在评估和外在评估,证明了该系统显著提高了歧视识别的词性和表现。
- MMUIT-HWDB: 使用转移学习方法构建越南随笔手写图像识别的新基准
本文提出了转移方法来构建手写图像数据集,以有效评估离线手写识别方法。我们提供了一个高质量的合成数据集,并使用各种现有方法进行了实验,以找出解决越南语手写识别问题的挑战。
- Basaa 语言的声调预测和正字转换
使用 seq2seq 模型结合 BERT 和 mT5 算法,针对录入非官方 Basaa 语言的基督教传教士的文字进行转写,取得了 CER 和 WER 等指标优秀的结果。
- 基于楚科奇语的低资源语言自动语音识别
本文介绍了一个自动语音识别 (ASR) 项目,旨在研究和创建基于楚科奇语的新 ASR 系统。该语言是一种低资源语言,也是一种多合成语,其对于任何自动处理都具有很大的复杂性。通过收集音频和文本数据,我们成功地训练了 XLSR 模型,并使用 C - YFACC: 通过视觉基础定位实现跨语关键字本地化的 Yorùbá 语言语音和图像数据集
本文介绍了一种基于注意力机制的 VGS 模型,通过将图像与 Yorùbá 语言的话语配对并自动标记英文视觉标签,实现了跨语言关键词定位,以解决新兴语种的语音系统数据不足的问题。
- 使用深度学习嵌入表示法进行自动司法语音比对时语言不匹配的影响
本研究旨在探讨在语言不匹配的情况下,预先在英语语料库上训练的模型是否适用于使用匈牙利语的目标低资源语言的嫌疑人语音识别,并发现在对嫌疑人的语音样本越长,预训练模型的性能越好。
- 豪萨视觉基因组:用于多模式英豪机器翻译的数据集
该研究创建了首个 Hausa Visual Genome 语料库,其中包含 32923 个图像及图像描述,可用于实现 Hausa-English 机器翻译、多模式研究、图像描述等多个自然语言处理和生成任务。
- 跨语言对话摘要挑战赛
本文提出 “ConvSumX Challenge”,为研究人员提供了研究整合对话摘要和机器翻译的解决方案的新途径,旨在打破非英语演讲者受益于最新对话摘要进展的壁垒。通过构建新的基准,涵盖 2 种实际情况和 3 种语言方向,包括低资源语言,以 - ACL低资源语言的同构跨语言嵌入
本论文提出了一种跨语言词嵌入学习框架,其综合利用相关高资源语言,以解决低资源语言跨语言表示学习中的几何结构相似度不足的问题,并通过双语词表感应和特征值相似性等多个语言对的实验验证,在新颖性和性能上均有所提升。
- 利用无监督和弱监督数据,提高直接语音翻译的准确性
本文旨在通过多种方法利用无监督和弱监督的语音和文本数据来提高基于 Translatotron 2 的直接语音到语音翻译系统的性能,实现在 21 种语言对上 BLEU 值提高 13.6(相对增长 113%),特别是对于低资源语言的提高更为显著 - EMNLPHintedBT:利用质量和音译提示增强的回译
提出了一种基于 Back-translation 的数据增强技术 HintedBT,并将其应用于低资源语言和异文翻译任务中,通过在编码器和解码器中添加标签提供相关信息,有效提高了翻译质量。
- COLING一份用于评估机器阅读理解的越南语数据集
本研究为缺乏基准数据集的低资源语言(如越南语)创建了一个新的数据集 UIT-ViQuAD,包含超过 23000 个由人类创建的问题 - 答案对和 174 篇来自维基百科的越南文章。通过用现有最先进的机器学习模型解决问题来比较联合测量人类表现 - FFR v1.1:法语 - 法语言机翻译
本研究介绍了一种从低资源语言 Fon 翻译成法语的神经机器翻译模型,通过描述 FFR 数据集、语音标点编码过程和 FFR v1.1 模型的训练过程,旨在打破非洲语言壁垒问题,提高翻译模型鲁棒性。
- ICLR五种非洲语言低资源神经机器翻译基准
研究了最近神经机器翻译 (NMT) 在英语和五种非洲低资源语言 (LRL) 对之间的效果,并表明多语言模型 (multilingual approach) 在某些翻译方向上有 +5 分数的提升。同时,提供标准的实验数据和测试集以供未来的研究 - ICLR使用 LSTM 将法语翻译为塞内加尔本地语言:以沃洛夫语为例
本文提出了一种针对 Wolof 语的神经机器翻译系统,采用基于 LSTM 的编码器 - 解码器结构,并通过引入双向 LSTM 和注意力机制来进一步扩展。实验结果表明,在非常低的资源条件下,该方法在法语 - Wolof 翻译任务中表现出有前途 - EMNLP跨语言机器阅读理解
提出了面向非英语语言的跨语言机器阅读理解(CLMRC)任务,通过双向 Bert 模型和回译方法,利用英语作为基础语言的大规模训练数据来提高低资源语言的阅读理解性能,并在中文机器阅读理解数据集上进行了实验,结果表明该方法能够显著提高机器阅读理