MMAug, 2020

Poet:面向电子商务的产品导向视频字幕生成器

TL;DR本文提出了一种基于 Poet 的产品导向视频字幕生成框架,该框架首先将视频表示为产品导向的时空图,然后基于视频相关产品的方面,在这些图上进行知识增强的时空推断,以捕获细粒度产品部件特征的动态变化。作者在两个产品导向的视频字幕生成数据集上进行了实验,表明 Poet 在生成质量、产品方面的捕获和词汇多样性方面取得了一致的性能提升,这表明 Poet 的设计能够有效解决产品促销中产品导向视频描述的问题。