Dec, 2020

何时需要记忆不相关的训练数据以实现高准确度学习?

TL;DR本研究旨在探讨现代机器学习模型是否必须要记忆所有训练样本中的信息才能够准确学习,对于这个问题,我们提出了两个预测问题的简单变体并进行了探究,结果表明,即使高维度的样本信息熵远高于样本数且其中的大部分信息与任务无关,每个准确的训练算法必须在其预测模型中编码所有有关大元素集合的信息,而这也不受算法或学习模型类别的影响。