Jun, 2022

低资源机器翻译中的后向翻译多样性探究

TL;DR本研究提出比以往更细致的 “多样性” 框架,将其分为词汇和句法多样性,并针对低资源和中资源机器翻译任务,提出创新的度量标准用于衡量这些不同方面的多样性。实证分析表明,使用核采样生成反向翻译能够提高最终模型性能,并且这种生成方法具有很高的词汇和句法多样性。研究还发现证据表明词汇多样性比句法多样性更重要。