Jun, 2024

从社会认知角度看:上下文感知的视觉社交关系识别

TL;DR通过结合社会认知角度,该研究提出了一种新的方法,ConSoR,以从视觉中识别上下文化的社会关系,并通过多模态适配器和视觉-语言对比机制加强对决定性视觉社会因素的识别,从而在PISC数据集上实现了12.2%的提升和PIPA基准上的9.8%提高,更可靠地揭示社会关系。