BriefGPT.xyz
Ask
alpha
关键词
multi-modal dialogue dataset
搜索结果 - 1
OpenViDial:一个包含视觉背景的大规模开放域对话数据集
本文提出了一个大规模多模态对话数据集 OpenViDial,并基于该数据集提出了一族多种编码器 - 解码器模型,使用了文本和视觉上下文。结果表明,多模态特征的整合可以显著提高对话生成的质量,是实现大规模多模态对话学习的重要一步。
PDF
4 years ago
Prev
Next