BriefGPT.xyz
Ask
alpha
关键词
language-video-temporal representations
搜索结果 - 1
CVPR
对比语言视频时间预训练
通过对比学习,LAVITI 引入了一种新方法来学习长视频中的语言、视觉和时间表示,目标是通过提取未修剪视频中的有意义的时刻来对齐语言、视频和时间特征,并使用可学习的时刻查询来解码视频和时间特征。此外,引入了相对时间嵌入(TE)来表示视频中的
→
PDF
a month ago
Prev
Next