AAAIJan, 2024

自我监督视觉变换器是不完善标签的高效分割学习器

TL;DR通过冻结自监督视觉变换器(SSVT)主干并训练轻量级分割头,我们展示了一种成本效益的语义分割方法。通过利用不完美的标签,我们的方法提高了对标签缺陷的鲁棒性,对于各种注释类型,包括涂鸦、点层和图像层标签,在现有方法上展现了显著的性能改进。这项研究突出了自监督视觉变换器在处理不完美标签方面的有效性,为语义分割提供了实用且高效的解决方案,同时降低了注释成本。通过大量实验,我们确认我们的方法在所有类型的不完美标签上优于基准模型,特别在基于零样本视觉语言模型的标签下,相对于基准模型展现了 11.5% 的性能提升。