May, 2023

使用属性本地化野外物体

TL;DR提出了一种名为LOWA的新方法,它基于视觉语言的训练策略,使用transformer架构,旨在解决当前基于开放词汇对象检测器的不足,用户不仅可以检测对象,还可以通过属性定位对象,并在OVAD基准测试和VAW数据集方面进行了评估,表现出较强的零样本性能,同时证明了该方法的每个训练步骤的有效性。