关键词multilingual translation models
搜索结果 - 4
- 构建和扩展印尼本地语言的低资源和代表性平行数据集
介绍了 Bhinneka Korpus 这一多语种并行语料库,以增强印度尼西亚当地语言资源的获取和利用,并通过 IBM 模型 1 实验表明该语料库在进一步发展低资源语言的高级 NLP 技术和多语种翻译模型方面显示出良好的性能。
- AraSpider: 民主化的阿拉伯语到 SQL
本研究提出了 AraSpider,这是首个用于改进阿拉伯语社区中自然语言处理(NLP)的 Spider 数据集的阿拉伯语版本。通过测试四种多语言翻译模型的效果来将英语转换为阿拉伯语,并评估两种模型在从阿拉伯文本生成 SQL 查询方面的能力。 - 利用自然语言提示进行机器翻译
本文旨在探讨自然语言提示在控制机器翻译模型输出方面的应用,并证明其能够影响输出的正式程度和具体方言等属性。研究还表明,使用语言名称控制多语言翻译模型的输出语言能够使得未见过的语言对之间产生积极的迁移效果,从而能够利用英文名翻译成未经微调的语 - 可扩展的跨语言预训练和微调技术实现多语言翻译
本文证明多语言预训练可以通过多语言微调来创建多语言翻译模型,并且证明在不失性能的前提下,预训练模型可以扩展到更多语言。此外,作者基于 ML50 数据集表明,多语言微调相较于其他训练方式有显著提升。