关键词multimedia event extraction
搜索结果 - 3
- 利用生成的图像和字幕训练多媒体事件提取
本文提出了一个名为 CAMEL 的跨模态增强多媒体事件学习方法(Cross-modality Augmented Multimedia Event Learning),它使用了人工生成的多模态训练数据,实现了领先水平,并在多媒体事件提取方面 - EMNLP视频和文章的联合多媒体事件抽取
本篇论文介绍了一种新的视频多媒体事件提取(Video M2E2)任务以及两个创新组件,用于构建该任务的第一个系统。该方法能够从视频和文本文档中提取结构化事件信息,未来将会公开发布包括 860 对视频 - 文章对的新基准。实验结果证明了该方法 - ACL跨媒体结构化共同空间用于多媒体事件抽取
该研究提出了一个新的任务 —— 多媒体事件抽取 (M2E2),旨在从多媒体文档中提取事件及其参数。研究使用弱监督训练策略,建立多媒体事件抽取的基准测试和数据集,并提出了一种新的方法 WASE,可将文本和视觉数据的语义信息编码到共同的嵌入空间