通过实验研究,我们发现在资源有限的情况下,从字符级识别转化成单词级可以显著提高低资源语言语音翻译的速度,并且在训练数据相对较少的情况下,仍然可以实现相对较高的词汇精度和召回率。
Mar, 2018
本文针对低资源语言语音合成任务,提出了从高资源语言中迁移知识的方法,并通过学习源与目标语言之间的语言符号映射,有效地构建了 TTS 系统,初步实验表明,只需要约 15 分钟的成对数据即可获得相对良好的 TTS 系统。
Apr, 2019
本文提出了改进低资源语音转文本翻译性能的技术和发现,实验结果显示多语言自动语音识别系统在低资源场景下作为良好的初始化,CTC 作为额外的目标有助于重新排序内部表示并提高最终翻译。通过实验,确定了对改进低资源设置最有贡献的各种因素(初始化、目标和超参数)。在只有 300 小时的预训练数据下,模型在 Tamasheq - French 数据中取得了 7.3 的 BLEU 分数,比 IWSLT 2022 的先前发表作品高 1.6 个百分点。
May, 2023
本研究提出了一种以数据增强为基础的方法,针对低频词汇在合成的新语境中生成新的句子对,以提高神经机器翻译系统的翻译质量。在模拟低资源环境中的实验结果显示,相对于基准和回译方法,我们的方法能够提高翻译质量,最高可提高 2.9 BLEU 分数。
May, 2017
本研究提出了一种基于双语词典的数据增强技术,使得机器翻译模型能够扩展词汇表而不会影响低资源环境下的合成句子的质量,我们的方法在性能上表现出可观的改进。
Apr, 2020
利用可学习的跨语言映射和数据增强来提高低资源语言的端到端语音识别准确度。
Jun, 2023
通过将多个低资源语言聚集在一起来实现地区组多语言 Transformer LM 的最佳性能,使得 Monolingual LM 候选模型表现更佳且减少维护成本和运营费用。
Sep, 2022
本文提出一种简单但有效的方法,即将目标语句重新排序以匹配源语序,并将其作为另外一种训练时的监督信号,从而在模拟低资源日语 - 英语和真实低资源维吾尔 - 英语语种中获得显着改进。
Aug, 2019
本研究聚焦于解决卡塔尔移民工人与医务人员之间的语言障碍问题,尤其是通过开发一种真实可行的印地语 - 英语机器翻译系统来提高医生和患者之间的交流质量,我们采用了各种方法来收集适合的训练数据,并成功地通过生成合成变量的方法自动扩充训练数据,从而实现了 BLEU 分数绝对值提高超过 3 分。
Oct, 2016
在这项工作中,我们将零样本语音克隆和多语言低资源语音合成的任务结合在一起。通过使用语言不可知的元学习(LAML)程序和对 TTS 编码器的修改,我们证明了一个系统可以学习在只有 5 分钟的训练数据下说一个新语言,同时保留了推断新学习语言中甚至看不到的说话者声音的能力,并提供了开源的代码和训练模型。
Oct, 2022