Mar, 2023

为实时足球解说生成挑战性的知识驱动视频字幕基准而设定的目标

TL;DR本研究提出了 GOAL 基准测试,通过 22k 个句子和 42k 个知识三元组,对超过 8.9k 个足球视频剪辑进行挑战性的新任务设置,即基于知识的视频字幕生成,旨在生成关于特定领域场景的生动、细致的视频描述,为自动体育叙述等领域提供了广泛应用。同时,对现有方法进行实验改进,展示了解决这一有价值有应用的任务的困难和潜在方向。