BriefGPT.xyz
Ask
alpha
关键词
video benchmarks
搜索结果 - 5
基于事件理解的视频数据集综述
通过调查 105 个需要事件理解能力的视频数据集,我们考虑它们对视频中鲁棒事件理解研究的贡献,并评估在这一研究领域中提出的视频事件提取任务,提出了基于调查结果的数据集策划和任务构建建议,特别强调视频事件的时间特性和视觉内容的歧义性。
PDF
22 days ago
基于群体感知的内容自适应神经网络视频压缩的参数高效更新
通过采用分组感知的参数高效更新(GPU)技术和轻量级适配器,该研究论文提出了一种适应内容的神经视频压缩方法,以提高适应性和压缩效率。实验证明该方法在四个视频基准测试和一个医学图像基准测试中展现出卓越的视频压缩效率。
PDF
2 months ago
ICCV
动作引导的掩模技术用于时空表示学习
我们提出了一种运动引导的掩蔽算法 (MGM),通过利用运动矢量来引导每个掩蔽的位置,从而更高效地利用视频显著性,与先前的最先进方法相比,在两个具有挑战性的大规模视频基准 (Kinetics-400 和 Something-Something
→
PDF
10 months ago
ICCV
简单算术运算对于时间建模有何作用?
通过计算加法、减法、乘法和除法等四种算术运算,提取帧特征产生辅助时间线索,利用这些线索从原时间无关域中提取对应特征,从而实现简化的时间建模。我们的研究表明,这种算术时间模块 (ATM) 在低计算成本下提供了强大的时间建模能力,并且与基于 C
→
PDF
a year ago
CVPR
运用头脑:提升长尾视频识别
本文对长尾视频识别进行了研究,提出了新的视频基准数据集和一种名为 Long-Tail Mixed Reconstruction 的方法,可显著减少过拟合并取得了最新的平均分类精度。
PDF
a year ago
Prev
Next