Jun, 2024

ViLCo-Bench: 视频语言连续学习基准测试

TL;DR本研究提出了第一个专门用于评估在各种视频文本任务中持续学习模型的基准数据集 ViLCo-Bench,并引入了一种新颖的内存高效框架,该框架结合了自监督学习,模拟长期和短期记忆效应,在面对长视频片段的内存复杂性、开放式查询的自然语言复杂性以及文本 - 视频不匹配等挑战时表现出色。