BriefGPT.xyz
Ask
alpha
关键词
inter-frame correlations
搜索结果 - 3
MM
视频指称理解中的对话问题
研究视频指代表达理解中的两个问题,提出了一种新颖的双重对应网络方法来增强帧间和跨模态的密集关联,以提高视频和图像 REC 基准测试的表现,并进行了全面的剖析研究。
PDF
2 years ago
CVPR
时间注意力模块:实现高效时空预测学习
本文研究了时空预测学习方法,提出了一种通用框架,其中空间编码器和解码器捕获帧内特征,中间的时间模块捕获帧间相关性。我们提出了一种时间注意力单元(TAU)以并行化时间模块,并引入新的差异散度正则化以考虑帧间变化。广泛的实验证明,该方法使得模型
→
PDF
2 years ago
基于空间和时间变换器网络的基于骨架的动作识别
本文提出了一种基于 Spatial-Temporal Transformer 网络的骨骼姿态行为识别方法,使用自注意力机制成功提取了骨骼运动及其相关性的信息,与其他同类算法相比在多个大规模数据集上表现出更好的精度。
PDF
4 years ago
Prev
Next