BriefGPT.xyz
Ask
alpha
关键词
temporal context modeling
搜索结果 - 4
IEBins:单目深度估计的迭代弹性分段
通过引入迭代弹性分区的概念,利用以分类 - 回归为基础的方法来搜索高质量的深度,最终的实验证明了该方法在 KITTI、NYU-Depth-v2 和 SUN RGB-D 数据集上超过了之前的最先进技术。
PDF
9 months ago
AAAI
对象查询传播在高性能视频对象检测中的应用
本篇论文提出了一种名为 QueryProp 的视频物体检测特征传播框架,通过对象级特征传播策略和自适应传播门进行关键帧选择,实现了高准确率和高速度的检测。
PDF
2 years ago
ECCV
多模态变长记忆转换器用于视觉语言导航
此篇研究提出了一种基于视觉和自然语言导航的多模态变长记忆转换器(MTVM)方法,用于模拟时间上下文,通过在存储器库中直接存储先前激活来跟踪导航轨迹,并提出了一种内存感知一致性损失来提高模型的性能。通过在 R2R 和 CVDN 数据集上的评估
→
PDF
3 years ago
弱监督视频显著目标检测
本文提出了基于新型弱标注的视频显著目标检测模型,并使用外观运动融合模块和双向 ConvLSTM 框架来实现有效的多模态学习和长期时序建模,还设计了一种前景背景相似度损失和一种弱标注增强策略,以提高模型性能和伪标签生成技术。在六个基准视频显著
→
PDF
3 years ago
Prev
Next