BriefGPT.xyz
Ask
alpha
关键词
temporal attention modules
搜索结果 - 2
EMNLP
LiteVL:增强空间 - 时间建模的高效视频 - 语言学习
本文提出 LiteVL 模型,结合 BLIP 图像语言模型,通过使用动态时态缩放,给图像编码器添加时间注意力模块,并提出非参数池化机制,以自适应地重新加权文本条件下的细粒度视频嵌入,取得了良好的性能,即使没有进行任何视频 - 语言预训练。
PDF
2 years ago
CVPR
长视频中基于排名感知的时间注意力技能判定的优缺点
通过可学习的时间注意力模块,我们提出了一个新的模型来确定长视频的相对技能。我们的方法训练了两个注意力模块,分别关注指示更高(pros)和更低(cons)技能的视频部分,并使用新颖的排名感知损失函数。该方法在 EPIC-Skills 数据集上
→
PDF
6 years ago
Prev
Next