BriefGPT.xyz
Jun, 2020
数据集蒸馏: 学习标签而非图像
Flexible Dataset Distillation: Learn Labels Instead of Images
HTML
PDF
Ondrej Bohdal, Yongxin Yang, Timothy Hospedales
TL;DR
针对数据集蒸馏的问题,我们提出了用合成标签来训练模型,比基于图像的方法更为有效;我们引入了更加鲁棒和灵活的元学习算法以及一种基于凸优化层的一阶策略,这种新算法可以提高模型的性能,并且可兼容各个优化器及不同的神经结构。我们的研究发现,标签蒸馏还能夸数据集应用,例如只通过合成标签的英文字母来训练以学习日文字母识别。
Abstract
We study the problem of
dataset distillation
- creating a small set of synthetic examples capable of training a good model. In particular, we study the problem of
label distillation
- creating synthetic labels fo
→