BriefGPT.xyz
Ask
alpha
关键词
referitgame
搜索结果 - 2
先斩后奏:一阶段视觉定位中学习地标特征
提出了一种 LBYL(“先看再跳”)网络,用于端到端可训练的单阶段视觉定位,其核心是地标特征卷积模块,以指导语言描述的方式传递视觉特征,并结合与目标的上下文信息进行定位,实验结果表明,LBYL-Net 在 ReferitGame 上优于所有
→
PDF
3 years ago
ECCV
递归子查询构建提升单阶段视觉定位
提出一种递归子查询构建框架,解决当前一阶段视觉基础的限制,提高了长而复杂查询的精度,效果比现有一阶段基线模型在多个基准数据集上都有显著的提高。
PDF
4 years ago
Prev
Next