Sep, 2023

视频摘要的有效性:量化语言在视频摘要中的影响

TL;DR通过仅使用通过零样本方法获取的文本标题,我们提出了一种高效的纯文本视频摘要方法,能够以高数据效率实现有竞争力的准确性。我们通过训练语言转换模型并摒弃图像表示来进行视频摘要,从而允许我们在代表性文本向量之间进行筛选并压缩序列。我们的方法能够使自然语言解释能力易于人类理解,以及对视频的文本摘要。调查了模态性和数据压缩的消融研究表明,仅利用文本模态有效地减少了输入的数据处理量,同时保持了可比较的结果。