BriefGPT.xyz
Jun, 2019
学习需要记忆吗?一个长尾故事的简短描绘
Does Learning Require Memorization? A Short Tale about a Long Tail
HTML
PDF
Vitaly Feldman
TL;DR
本文提出了对于自然数据分布来说,必须要对标签进行记忆才能达到接近最优的泛化误差的第一概念解释和理论模型。该模型支持最近几项实证研究的结果,发现对于长尾子群分布的数据采样,标签的记忆是必要的,而图像和文本数据也被证明是长尾的。我们的研究不仅可能量化在学习过程中限制记忆的代价,而且还能解释隐私和模型压缩对不同子组的影响不同的不同效应。
Abstract
State-of-the-art results on
image recognition
tasks are achieved using
over-parameterized learning
algorithms that (nearly) perfectly fit the training set. This phenomenon is referred to as data interpolation or,
→