EMNLPSep, 2018

基于游戏的视频上下文对话

TL;DR本文介绍了基于现场足球比赛视频和 Twitch.tv 聊天记录的多说话者、视觉语境下的对话数据集,利用此数据集开发出具有多模态对话技能和视觉定位应用的对话模型,并通过多项评估指标和人类评估研究验证其效果。