parallel dataset | BriefGPT

关键词parallel dataset

搜索结果 - 4

COLING机器翻译的土鲁语资源
我们提供了第一个用于英图鲁翻译的并行数据集。我们使用该数据集开发了英图鲁机器翻译模型，并采用了转移学习方法来解决低资源语言的机器翻译开发中的障碍。
PDF3 months ago
BEnQA：孟加拉语和英语的问题回答与推理基准
本研究介绍了 BEnQA 数据集，该数据集包括孟加拉国中学和高中水平的平行孟加拉语和英语考试题目。我们的数据集包含大约 5,000 个问题，涵盖了科学的多个学科，并包含事实、应用和推理类问题。我们使用平行数据集对多个大型语言模型进行了基准测
PDF4 months ago
消除印度机器翻译任务流行数据集中的误译方法
使用最大的公开可访问的印度语言平行数据集 Samanantar 进行实验，在二种印度语言 Hindi 和 Odia 上构建一个基准神经机器翻译系统，并通过消除数据集中的错误翻译来提高翻译质量，进而发现尽管 ILs-English 和 Eng
PDF6 months ago
EMNLPPhoMT: 一个高质量和大规模的越南语 - 英语机器翻译基准数据集
本文介绍了一个高质量、大规模的越南语 - 英语平行数据集，进行了机器翻译的比较实验，结果表明在预训练序列到序列去噪自编码器 mBART 上的微调获得了最好的性能，这是第一个大规模的越南语 - 英语机器翻译研究，希望这个公开的数据集和研究能成
PDF3 years ago