Jun, 2023

自监督变压器中的亲和关注预测人类物体分组动态

TL;DR提出了一种基于自监督 Transformer 模型的人类目标注意力扩散和分割模型,其通过图像中不同区域之间的特征亲和信号实现目标内的注意力扩散。研究发现,基于该模型的亲和扩散能够显著提高自然图片中对象分组的准确性,为评估不同视觉表征学习模型提供了新的基准。