Jun, 2023
基于电视剧的大规模情节导向多模态数据集 PTVD
PTVD: A Large-Scale Plot-Oriented Multimodal Dataset Based on Television Dramas
Chen Li, Xutan Peng, Teng Wang, Yixiao Ge, Mengyang Liu...
TL;DR该研究通过使用 1,106 集电视剧和 24,875 个由专业人士编写的信息密集的剧情句子,进行 449 个人类注释者的标注,构建了第一个面向剧情的电视领域的多模态数据集 PTVD,同时也是该领域中第一个非英文的数据集,并开发了多模态算法,针对不同的电影 / 电视建模问题进行处理,并在三个认知启发任务上进行了广泛的实验,从而验证了该数据集在促进多模态研究上的价值。