CVPRMay, 2022

标题:字幕中的内容?数据集特定的语言多样性及其对视觉描述模型和度量的影响

TL;DR研究自动视频描述领域的发展,发现数据集所具有的语言多样性是影响生成泛化性通用和无信息的描述文本的关键因素。推荐多样性采集新数据的方法和应对当前模型和指标多样性有限的后果的方法和方法。