时间考验：让视频语言模型具有时间感

Jan, 2023

时间考验：让视频语言模型具有时间感

Test of Time: Instilling Video-Language Models with a Sense of Time

Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek

TL;DR本文旨在向已有视频语言模型注入时间感，通过后预训练等方式实现，观察经过处理后的模型在时间感知任务中的性能提升情况，并在六个数据集上进行了零样本评估。

Abstract

Modeling and understanding time remains a challenge in contemporary video understanding models. With language emerging as a key driver towards powerful generalization, it is imperative for foundational video-language models to have a sense of time. In this paper, we consider a specific

video-language models temporal understanding time awareness post-pretraining zero-shot evaluation

发现论文，激发创造

时间感知的视频 - 语言预训练

本研究提出了一种文本 - 视频本地化预文本任务，以实现细粒度的时间和语义对齐，从而让训练模型能够准确感知给定文本描述的视频时间边界，并且实验结果表明该方法在各种基准测试中显著提高了最先进的性能。

Jan, 2023

重新审视视频语言理解中的 “视频

通过提出 atemporal probe 模型，本文探讨了视频和语言任务中现有的模型的局限性和潜力，并发现即使在面向较深层次视频理解的基准测试中，理解事件时间通常也不是实现强大或最新技术的性能所必需的。

Jun, 2022

设定时钟：预训练语言模型的时间对齐

通过对预训练语言模型进行时间对齐，本研究探索了将内在知识与目标时间对齐的方法，并发现对年份为 2022 的 LLaMa2 模型进行对齐可以将其性能相对提高 62%，此外，该研究还发现对历史时间进行对齐同样是可行的，可以使模型在 2010 年的性能提高 2.8 倍。

Feb, 2024

视频时间：属性、编码器和评估

本研究提出了一个评估视频时间的方法，通过描述视频时间的三个属性并将其量化，为现代视频编码器提供效果评估，同时推荐了一种更适合视频时间识别任务的新型视频时间编码器。

Jul, 2018

使用时间语言定位视频中的瞬间

本文提出了一种新模型，该模型可以明确地推理视频中的不同时间片段，证明了在包括时间语言的短语定位中，时间上下文的重要性，并通过 TEMPO 数据集进行了实验以验证模型可靠性。

Sep, 2018

扩展语言图像预训练模型以实现通用视频识别

本文提出一种简单有效的方法，将预先训练好的语言 - 图像模型直接应用于视频识别中，使用跨帧注意力机制及视频特定提示方案，实现对长时序列的检测，提高了零样本下的准确率。

Aug, 2022

VITATECS：用于视频语言模型的时间概念理解诊断数据集

通过引入细粒度的自然语言中的时间概念的分类，利用反事实视频描述来解开静态和时间信息之间的相关性，并评估典型的视频语言理解模型，揭示了对于视频语言研究中时间元素的更大重视的需求。

Nov, 2023

Mind the Gap: 评估神经语言模型的时间泛化能力

研究表明，Transformer-XL 语言模型在预测超出其训练期的未来话语时，性能会随着时间的推移而逐渐降低。基于此，提出了动态语言建模的思路，并通过不断更新知识来缓解性能退化问题。因此，应重新思考我们目前培训和评估语言模型的方法，并发展出适应我们日益变化和非稳定的世界的自适应语言模型。

Feb, 2021

探寻语言模型对时间表达的理解能力

该研究针对自然语言推理（NLI）挑战，提出了三个涉及时间表达式的挑战集，包括时间点之间的顺序、时间之间的持续时间及不同单位时间的大小关系，并发现尽管很多 MNLI 预训练大语言模型对时间点之间的顺序有基本的认知，但它们并没有充分理解时间表达式之间的关系。

Oct, 2021

分析视觉语言模型在视频理解任务上的零样本能力

我们通过对图像文本模型在视频理解任务中的泛化能力进行详细研究，发现这些模型在视频行动识别、视频检索和视频多项选择方面表现出强大性能，对视频字幕能力中等，对视频问答能力较差，这些结果揭示了在避免昂贵的预训练阶段的同时，将基础图像文本模型应用于各种视频任务的益处。

Oct, 2023