BriefGPT.xyz
Ask
alpha
关键词
mamo
搜索结果 - 2
ICCV
MAMo:利用记忆和注意力进行单目视频深度估计
我们提出了 MAMo,这是一种新颖的内存和注意力框架,用于单目视频深度估计。MAMo 可以将任何单幅图像深度估计网络增强和改进为视频深度估计模型,使其利用时间信息以预测更准确的深度。通过在视频中流式传输的模型中增加内存,MAMo 在深度预测
→
PDF
a year ago
MAMO: 面向细粒度视觉语言表征学习的遮蔽多模态建模
本文提出一种联合掩蔽多模态建模方法 (MAMO),通过联合掩盖图像 - 文本输入,并通过隐式和显式目标来恢复掩蔽信号,从而学习细粒度的多模态表示,实现高级和语义明确的信息恢复,取得了各种下游视觉 - 语言任务中的最新成果。
PDF
2 years ago
Prev
Next