关键词text image machine translation
搜索结果 - 2
- 文本图像机器翻译的多教师知识蒸馏
本文提出一种基于多教师知识蒸馏 (MTKD) 的文本图像机器翻译 (TIMT) 方法,将管道模型的知识有效地转移至端到端 TIMT 模型中,包括图像编码器、序列编码器和解码器的知识引导优化,并采用令牌和句子级别知识蒸馏相结合来提高翻译性能。 - E2TIMT:用于文本图像机器翻译的高效有效的模态适配器
本文旨在提出一种新型的端对端的文本图像翻译模型,充分利用现有的 OCR 和 MT 数据集的知识来追求既有效又高效的框架。我们建立了一种新颖的模态适配器,有效地连接 OCR 编码器和 MT 解码器,并联合使用端到端 TIMT 损失和跨模态对比