Dec, 2024
神经网络中软标签与硬标签训练的理论分析
A Theoretical Analysis of Soft-Label vs Hard-Label Training in Neural
Networks
TL;DR本文探讨了知识蒸馏中软标签训练为何需要显著少于硬标签训练的神经元数量。研究表明,软标签训练在准确性上持续优于硬标签训练,特别是在数据集难度增加时,且理论上证明软标签训练的神经元需求可低至$O\left(\frac{1}{\gamma^2 \epsilon}\right)$,而硬标签训练则高达$O\left(\frac{1}{\gamma^4} \cdot \ln\left(\frac{1}{\epsilon}\right)\right)$,显示了其在分类困难场景下的优势。