Dec, 2023

零样本视频问答与程序化程序

TL;DR我们提出使用程序化的短程序来回答关于视频的零样本问题,通过解决一系列视觉子任务来得出最终答案。我们提供的 ProViQ 框架在视频理解方面取得了最先进的结果,并在多个基准测试中实现了高达 25% 的提升,可以执行除了问题回答之外的其他视频任务。