Jun, 2024

通过眼罩驱动的信息瓶颈学习无监督的凝视表示

TL;DR本研究提出了一种新的无监督 / 自监督凝视预训练框架,通过协同特征对比和挤压模块,强制全脸分支学习一个低维度凝视嵌入,无需凝视注释,并采用交替注视 / 不注视眼睛的屏蔽训练方案,进一步提升学习到的表示,并取得了优于无监督最新技术的性能。