简化密集视频字幕生成

Apr, 2019

Streamlined Dense Video Captioning

Jonghwan Mun, Linjie Yang, Zhou Ren, Ning Xu, Bohyung Han

TL;DR本文提出了一种新颖的密集视频字幕框架，它通过显式建模视频中事件的时间依赖性并利用先前事件的视觉和语言上下文来实现连贯的叙述。该框架由事件序列生成网络和序列视频字幕网络组成，后者利用强化学习进行训练，并在事件和剧集两个级别上进行两级奖励以实现更好的上下文建模。在大多数指标上，该方法在ActivityNet Captions数据集上取得了出色的表现。

Abstract

dense video captioning is an extremely challenging task since accurate and coherent description of events in a video requires holistic understanding of video contents as well as contextual reasoning of individual events. Most existing approaches handle this problem by first detecting e

发现论文，激发创造

视频中的密集事件描述

本篇研究介绍了一种能够在视频中检测和描述事件的新模型，同时使用过去和未来事件的上下文信息来联合描述所有事件，并介绍了一个用于密集事件字幕的基准测试集ActivityNet Captions。

May, 2017

连续视频流中的事件检测和描述

JEDDi-Net是一种用于密集视频字幕生成的神经网络，它通过三维卷积层对输入视频流进行连续编码，并使用时间池化特征提出可变长度的时间事件，再生成它们的字幕。在大规模数据集上，JEDDi-Net 表现出了优异的性能。

Feb, 2018

基于上下文门控双向注意力融合的密集视频字幕生成

本研究提出一种双向提案方法、注意力融合和上下文门控机制，将提案与字幕模块结合到一个统一的框架中，以在活动网字幕数据集上实现相对增益超过100％（Meteor得分从4.82增加到9.65）的优异表现。

Mar, 2018

密集视频字幕生成中的事件定位与描述

本文提出了一种新的密集视频字幕生成框架，该框架将时间上的事件提案的本地化和生成句子主体的合并，通过端到端的联合训练结构。这种模型在ActivityNet Captions数据集上的实验显示出了与现有技术相比的明显改进，创造了12.96％的新的METEOR记录。

Apr, 2018

向前并讲述：视频描述的渐进式生成器

本研究提出了一种基于序列学习的新方法，通过选择一系列鲜明的视频片段和产生连贯的句子描述来生成对给定视频的一个连贯段落描述。该方法在ActivityNet Captions数据集上表现出能够生成高质量段落描述的能力，比其他方法产生的描述更相关、更连贯和更简洁。

Jul, 2018

视频中弱监督稠密事件字幕生成

本文提出一个无需时间片段注释的方法：针对视频中所有感兴趣事件的稠密描述，基于一一对应的假设，将该问题分解为事件字幕和句子定位的双重问题，并提出了一种循环系统来训练模型。通过大量实验结果证明了该方法在视频事件字幕和句子定位方面的有效性。

Dec, 2018

2019年Activitynet第三项任务：探索视频中复杂事件的背景

本研究系统地探索了不同的视频字幕模型，提出了五种上下文和两类事件字幕模型，并从准确性和多样性两个角度评估了它们对事件字幕的贡献，该提出的字幕模型被插入到我们的管道系统中，本系统在视频任务的密集字幕事件上取得了最新颖的表现。

Jul, 2019

清华大学人工智能联盟团队2020 Activitynet任务二技术报告: 探索密集视频字幕的顺序事件检测

提出了一种用于密集视频字幕的事件序列生成模型，通过双向时间依赖在一次传递中生成事件边界来探索视频中的时间关系，避免了低效的两阶段提议生成，并在事件字幕模型中取得了最新的性能。

Jun, 2020

端到端密集视频字幕生成

本文提出一种联合建模的方法，将稠密视频字幕的两个子任务共同作为一个序列生成任务，同时预测事件和相应的描述，并使用YouCook2和ViTT的实验结果表明了该方法的可行性和在大规模预训练模型中集成端到端密集视频字幕等复杂任务中的适用性。

Apr, 2022

通过预训练将事件检测和字幕生成统一为序列生成

本文定义了事件检测为序列生成任务，提出了一种统一的预训练和微调框架，以自然地增强事件检测和字幕生成之间的相互关联。实验结果表明，我们的模型优于最先进的方法，并且在额外的大规模视频文本数据上进行预训练可以进一步提升性能。

Jul, 2022