May, 2022

相互信息散度:多模态生成模型的统一度量

TL;DR采用 CLIP 特征的负高斯交叉互信息度量被提出,用于评估 text-to-image generation 和 image captioning 任务的机器智能水平,与竞争指标相比具有一致性、样本简约性和鲁棒性,并在多模态表示学习中得到了广泛的应用。