May, 2016

多模态对人类和机器在翻译和图像字幕中是否有帮助?

TL;DR本文介绍了 LIUM 和 CVC 为 WMT16 Multimodal Machine Translation Challenge 开发的系统。我们在单模态数据和多模态数据的基础上,探索了各种比较方法,包括基于短语的系统和使用单模态或多模态数据训练的注意力循环神经网络模型。我们还进行了人类评估,以估计多模态数据对于人机翻译和图像描述生成的实用性。根据自动评估指标 BLEU 和 METEOR,我们的系统在这两个任务中获得了最佳结果。