Jul, 2024

强化学习和训练评估器的无监督视频摘要

TL;DR提出了一种采用增强学习的无监督视频摘要新方法,通过引入生成-判别器体系结构的不稳定训练和依赖手工制定的质量评估奖励函数等问题,改进无监督方法,使其产生与原始视频密切相似的精炼信息摘要。通过采用特殊的奖励生成流程,通过强化学习调训摘要模型的方式,生成模型可以从被部分覆盖的视频中重建部分帧,并将重建的摘要视频与原始视频进行比较。实验结果表明,该训练流程生成的摘要模型较之于依赖手工制定奖励的方法更好地模仿人工生成的摘要视频,其F值在TVSum和SumMe数据集上分别为62.3和54.5。此外,该方法在推理阶段的速度比先前报道的最先进方法快300倍。