May, 2023

文本图像机器翻译的多教师知识蒸馏

TL;DR本文提出一种基于多教师知识蒸馏 (MTKD) 的文本图像机器翻译 (TIMT) 方法,将管道模型的知识有效地转移至端到端 TIMT 模型中,包括图像编码器、序列编码器和解码器的知识引导优化,并采用令牌和句子级别知识蒸馏相结合来提高翻译性能。实验结果表明,相比于现有的管道和端到端模型,MTKD 可以更有效地改进文本图像翻译性能,具有更少的参数和更少的解码时间。