Jan, 2023

MAQA: 一个用于否定多模态问答的基准数据集

TL;DR该研究旨在评估多模态转换器是否可以执行复杂的推理来识别新概念作为先前学习的概念的否定,研究通过描述一种使用音频集中标注的音乐视频的多模态问答基准测试和一种新型数据生成程序确定了这种方法的有效性。