Jul, 2016

大规模图像分类的信息理论标签嵌入

TL;DR本文介绍了一种用于训练多标签、大规模多类别图像分类模型的方法,通过将高维稀疏标签嵌入到具有单位范数的低维密集球体上,并将分类问题视为该球体上余弦相似度回归问题,其比基于逻辑回归的 sigmoid 交叉熵损失函数的监督方法更快更准确,经过在 300 million 高分辨率图像和 17,000 标签的数据集上测试,相对于逻辑回归,该方法收敛速度明显提高,平均精度也提高了 7%。