Dec, 2016

在 Flickr 中进行标签预测:来自暗房的视角

TL;DR本文讨论了如何开发一个大规模的自动照片标注系统,提出了一些重要的考虑事项,包括如何为用户选择最重要的标签、如何开发高性能的模型以进行标签预测,以及如何利用大量噪声数据进行训练。通过使用用户生成的数据,我们的结果表明,对于现实世界的数据集,仅使用这些噪声数据的训练效果与先预先训练干净的数据再进行微调的标准范例的表现相当。