ACLApr, 2021

神经机器翻译蒸馏数据的采样和过滤

TL;DR本文探究了利用重要性抽样法进行神经机器翻译中的知识蒸馏,包括剪枝、假设上采样和下采样、去重和它们的组合,并使用标准的翻译质量评估方法对英德和英捷翻译模型进行训练与测试,结果显示,仔细选择合适的数据进行上采样并与原始数据组合,可获得更好的性能提升。