BriefGPT.xyz
Ask
alpha
关键词
object segmentation masks
搜索结果 - 3
被注意力背叛:一种简洁而有效的自监督视频对象分割方法
我们提出了一个简单而有效的方法来进行自监督视频对象分割 (VOS)。我们的关键观点是,DINO 预训练的 Transformer 中具有的固有结构依赖性可以用于建立视频中的稳健时空对应关系。此外,利用这种对应线索进行简单的聚类就足以产生具有
→
PDF
7 months ago
MM
GLaMM: 像素 grounding 大规模多模态模型
GLaMM 是首个能够无缝生成自然语言回复并与相应对象分割遮罩混合的模型,在图像和文本领域中以不同粒度的方式与模型进行交互,同时通过 GLaMM,还可以在诸多其他任务中有效地实现指代表达分割、图像和区域级别的字幕以及视觉语言对话。
PDF
8 months ago
Diff-DOPE:可微分的深度目标姿态估计
我们引入了 Diff-DOPE,这是一种 6 自由度姿态微调器,其输入为图像、一个物体的 3D 纹理模型和物体的初始姿态。这种方法使用可微渲染来更新物体姿态,以减小图像与模型投影之间的视觉误差,我们展示了这种简单且有效的想法能在姿态估计数据
→
PDF
9 months ago
Prev
Next