从密集视频字幕中提取语义元数据

Nov, 2022

从密集视频字幕中提取语义元数据

Semantic Metadata Extraction from Dense Video Captioning

Johannes Scherer, Ansgar Scherp, Deepayan Bhowmik

TL;DR通过使用MT和PVDC生成视频字幕，我们提出了一个从自动生成的视频字幕中提取语义元数据的框架。我们的实验表明，可以从生成的字幕中提取实体，属性，实体之间的关系和视频类别。

Abstract

Annotation of multimedia data by humans is time-consuming and costly, while reliable automatic generation of semantic metadata is a major challenge. We propose a framework to extract →