BriefGPT.xyz
Ask
alpha
关键词
bitexts
搜索结果 - 4
更好的多语言表示学习:超越以英语为中心的双语语料
本文介绍了一种构建多语言表示模型的方法,该方法不仅可以与现有的最先进的模型竞争,而且还更加参数高效,从而促进了资源受限情况和实际应用的更好采用。
PDF
2 years ago
对比学习在低资源语言的双语文本挖掘中的应用
本文介绍了一种针对低资源语言挖掘高质量双语数据的方法,即使用多负对比损失进行语言模型微调,可以获得更干净的双语数据,实验证明,在高棉语和普什图语等低资源语言数据挖掘方面,该方法明显优于以往的最先进方法。
PDF
2 years ago
利用伪参考文本并减少重新排序来提高同声传译质量
提出了一种将现有的全句子语料库改写为同时翻译风格的新方法,用生成的伪参考文本增强机器翻译系统,在中英文和日英文同时翻译任务中获得高达 2.7 BLEU 的显著改善。
PDF
4 years ago
HELFI:一种带有跨语言形态素对齐的希伯来语 - 希腊语 - 芬兰语平行圣经语料库
本文介绍了一个包含源文本、翻译、词汇分析和跨语言形态素对齐的数据集,它是通过使用免费的文本版本和标注来重建一个人工构建的位对位语料库的。
PDF
4 years ago
Prev
Next