BriefGPT.xyz
Ask
alpha
关键词
key frames
搜索结果 - 2
VLAP: 通过帧提示和蒸馏实现高效视频 - 语言对齐用于视频问答
我们提出了一种高效的视频 - 语言对齐方法(VLAP),通过帧提示和蒸馏来实现。我们的 VLAP 模型以统一的方式解决了有效的帧采样和有效的跨模态对齐问题。与之前的工作相比,我们的 VLAP 模型在选择具有关键内容的关键帧的能力方面表现出色
→
PDF
7 months ago
MM
高效视频分类的深度非监督关键帧提取
本文提出了一种基于 CNN 和 TSDPC 的无监督关键帧检索方法,能够自动计算关键帧数量并保留视频时间信息,此外,还加入了 LSTM 网络和权重融合策略来提升分类性能和效率,并在两个常用数据集上进行了评估,结果表明与现有方法相比,该方法具
→
PDF
2 years ago
Prev
Next