Jun, 2023

基于电视剧的大规模情节导向多模态数据集 PTVD

TL;DR该研究通过使用 1,106 集电视剧和 24,875 个由专业人士编写的信息密集的剧情句子,进行 449 个人类注释者的标注,构建了第一个面向剧情的电视领域的多模态数据集 PTVD,同时也是该领域中第一个非英文的数据集,并开发了多模态算法,针对不同的电影 / 电视建模问题进行处理,并在三个认知启发任务上进行了广泛的实验,从而验证了该数据集在促进多模态研究上的价值。