BriefGPT.xyz
大模型
Ask
alpha
关键词
localizing objects
搜索结果 - 3
ICCV
Multi3DRefer: 文本描述与多个 3D 对象的关联
我们介绍了使用自然语言描述来定位现实世界 3D 场景中多个对象的任务。我们提出了 Multi3DRefer,扩展了 ScanRefer 数据集和任务,并引入了新的评估指标和基准方法以进一步研究多模态 3D 场景理解。此外,我们利用 CLIP
→
PDF
10 months ago
使用属性本地化野外物体
提出了一种名为 LOWA 的新方法,它基于视觉语言的训练策略,使用 transformer 架构,旨在解决当前基于开放词汇对象检测器的不足,用户不仅可以检测对象,还可以通过属性定位对象,并在 OVAD 基准测试和 VAW 数据集方面进行了评
→
PDF
a year ago
无监督 Transformer 定位物体
本文提出了一种不需要昂贵的注释活动的图像集合中的目标本地化的简单方法(称为 LOST),该方法利用了以自我监督方式预训练的视觉转换器的激活特征,同时在 PASCAL VOC 2012 上的实验表明,该方法优于最先进的目标发现方法最高可达 8
→
PDF
3 years ago
Prev
Next