Jun, 2021
解决零样本学习语义与视觉混淆问题
Disentangling Semantic-to-visual Confusion for Zero-shot Learning
TL;DR本文提出了一种利用多模态信息搜索解缠表示空间的多模态三元组损失模型(MMTL),并且发展了一种名为“解开类表示生成对抗网络(DCR-GAN)”的新型模型,该模型能够在训练、特征合成和最终识别阶段利用解开表示,从而使得DCR-GAN能够拟合更真实的分布。实验证明,该模型在四个基准数据集上的性能优于现有的技术。