AAAIJul, 2020
通过数据增强的问答方法进行多模态对话状态跟踪
Multimodal Dialogue State Tracking By QA Approach with Data Augmentation
Xiangyang Mou, Brandyn Sigouin, Ian Steenstra, Hui Su
TL;DR文章提出了一个基于多模态融合和注意力机制的开放域问答系统,用于解决 Audio-Video Scene-Aware Dialogue(AVSD)任务,结果表明基于问答假设的数据增广技术和模型均能在 DSTC7-AVSD 数据集上带来显著的改进。