Jul, 2023

依存子树交换增强机器翻译数据

TL;DR本文介绍了一种适用于机器翻译的数据增强的通用框架,该框架通过依赖子树交换进行数据增强,使用依赖解析树中的相应子树从源文本和目标文本中提取并交换,从而创建扩充样本,然后具有过滤、相似度检查和语义一致性检查等额外的方法和准则,实验证明该方法在 BLEU 分数上实现了一致的提高。