Dec, 2020

OpenViDial:一个包含视觉背景的大规模开放域对话数据集

TL;DR本文提出了一个大规模多模态对话数据集 OpenViDial,并基于该数据集提出了一族多种编码器 - 解码器模型,使用了文本和视觉上下文。结果表明,多模态特征的整合可以显著提高对话生成的质量,是实现大规模多模态对话学习的重要一步。