BriefGPT.xyz
Ask
alpha
关键词
video feature extraction
搜索结果 - 3
SFMViT:慢快相遇在混沌世界中
通过使用具有高质量视频特征提取的双流时空特征提取网络 SFMViT 和锚定修剪策略,我们有效地提高了模型性能,并在混乱场景中实现了 26.62% 的平均精度 (mAP)。
PDF
2 months ago
稳健视频特征提取的时空提示网络
帧质量下降是视频理解领域中的主要挑战之一。为了弥补由于帧质量下降而引起的信息损失,最近的方法利用基于 Transformer 的集成模块来获得时空信息。然而,这些集成模块过于复杂和繁重。在本文中,我们提出了一个简洁且统一的框架,称为时空提示
→
PDF
5 months ago
密集视频字幕:技术、数据集和评估协议综述
使用 Dense Video Captioning (DVC) 技术,本文综述了在描述长视频时需要突出显示的相互关联事件、依赖关系、上下文、重叠事件、物体间的相互作用以及领域特定性等语义,同时讨论了 DVC 的子任务和它们的结果,涵盖视频特
→
PDF
8 months ago
Prev
Next