ACLMay, 2023

多模态码本在文本图像翻译中的应用

TL;DR本文提出了多模态码本的 TIT 模型和多阶段的培训框架,充分利用 OCR 数据集和我们的 OCRMT30K 数据集训练模型,为后续研究提供便利。