关键词temporal attention module
搜索结果 - 4
- 基于残差估计的视频立体匹配的灵活递归网络
基于残差估计的递归结构网络 RecSM 用于视频立体匹配,通过计算当前帧与前一帧之间的残差值,仅利用时间上下文作为参考,快速计算当前帧的位移,同时使用 DOM 和 TAM 模块进一步减少估计误差,堆叠式计算结构 (SCS) 实现可扩展性。实 - 利用文图扩散模型实现一致的视频编辑
本文提出了 EI ^ 2 模型,主要解决 Text-to-Image 的视频编辑中存在的文本指示不一致和时间序列问题,通过引入 Shift-restricted Temporal Attention Module (STAM) 和 Fine - ECCVNSNet:用于高效视频识别的非显著性抑制采样器
该研究提出了一种有效的非显著性抑制网络 (NSNet),该网络可以在硬件计算速度低下的情况下实现高精确度的视频识别。通过在帧级别生成伪标签,并在视频级别上学习时间注意,NSNet 有效地抑制了非关键帧的响应,并取得了显著的时间和效率改进。
- CVPR基于字符 — 上下文解耦的开放式文本识别
本文提出了一个字符 - 上下文解耦模型,该模型通过分离上下文信息和字符视觉信息来缓解上下文信息对识别性能的影响,通过定时注意力模块隔离时间信息和语义锚定机制分离语言信息,本方法在开放式、零样本和闭合式文本识别数据集上取得了有希望的表现。