CVPRMar, 2021

检索 - 复制 - 生成网络实现开放式视频字幕生成

TL;DR本研究提出一种新的视频字幕生成方法:Open-book Video Captioning,其中利用 Retrieve-Copy-Generate network,并结合视频语意的句子作提示,从训练语料库检索出相关句子,再结合 copy-mechanism generator 的作用动态生成字幕内容,将传统的基于视频内容的检索方式有效扩展为基于检索句子的方式,并在多个基准测试数据集上进行了广泛实验和测试,得出本方法的实现方式超越了现有的技术水平。