Sep, 2017

使用深度学习从标签比例进行人口分类的共同训练

TL;DR本文介绍了一种在无标注训练样本的情况下,通过使用深度神经网络,并引入一种新正则化层 Batch Averager,将有标注数据的深度神经网络转换为无标注学习(LLP)的方法。本文还提出了一种协同训练算法,以支持可能由图片和文本组成的数据域。作者通过 Twitter 用户的 tweets 和个人资料图片,预测 Twitter 用户的性别和种族 / 民族信息,并发现深度 LLP 方法在文本和图片分类方面均优于基线方法,并且协同训练算法可以将文本和图片分类的绝对 F1 值分别提高 4%和 8%。最后,采用文本和图片分类器的集合进一步平均提高了绝对 F1 值 4%。