Jul, 2024

CountGD: 多模态开放世界计数

TL;DR这篇论文旨在提高图像中开放词汇对象数量计数的普适性和准确性,通过引入多模态的文本和实例作为目标对象,改进了现有的计数模型。通过 CountGD 模型,既可以使用文本描述,也可以使用视觉实例或两者结合来提供计数提示,从而在多个计数基准测试中表现出色,超过了以往所有的模型。