Apr, 2022

跨模态原型对比的无监督语音-脸部表征学习

TL;DR本文提出了一种跨模态原型对比学习的方法,该方法通过无监督聚类在不同模式下构建语义上的正样本,并通过比较跨模态实例的相似性来动态重新校准无法学习的实例对总体损失的贡献,最终实验证明,该方法在各种语音-面部相关性评估协议中均优于最先进的无监督方法,并且在低投入监督设置中,与之前的实例级对比学习相比也有显着改进。