BriefGPT.xyz
大模型
Ask
alpha
关键词
corpus filtering
搜索结果 - 4
没有比更好的数据更好的数据:使用质量度量对 MT 数据进行过滤
使用质量评估(QE)指标过滤训练数据的句子对可以提高翻译质量并减少训练规模一半。
PDF
8 months ago
少即是多”:“少样本” 质量评估基于语料库过滤提升机器翻译
本文提出了一种基于质量评估的过滤方法,以从伪平行语料库中提取高质量的平行数据,并通过使用过滤后的语料库进行训练,改善了机器翻译系统的性能。该方法在英语 - 马拉地语、中文 - 英语和印地语 - 孟加拉语语言对中表现出了很好的效果,通过迁移学
→
PDF
a year ago
利用短语对注入和语料过滤改进机器翻译
本论文表明,短语注入和语料库过滤的组合提高了神经机器翻译 (NMT) 系统的性能。我们从伪平行语料库中提取并增广平行短语和句子,以此训练 NMT 模型。在 Hindi-Marathi、English-Marathi 和 English-Pa
→
PDF
a year ago
使用抽象意义表示法测量细粒度语义等效性
本篇研究提出了一种新方法用于识别句子间的语义等效性,该方法基于抽象意义表示图结构,并展示了这种方法在语义相似度方面的精度更高,认为这有助于减轻人类对机器翻译的后期编辑和对句子相似度的人工评估的负担。
PDF
2 years ago
Prev
Next