Jun, 2023

利用生成的图像和字幕训练多媒体事件提取

TL;DR本文提出了一个名为 CAMEL 的跨模态增强多媒体事件学习方法(Cross-modality Augmented Multimedia Event Learning),它使用了人工生成的多模态训练数据,实现了领先水平,并在多媒体事件提取方面优于现有研究。