Feb, 2017

通过考察测试集难度理解深度学习性能:一项心理测量案例研究

TL;DR研究了深度学习模型性能评估中忽略的数据点特征和难度对测试集准确性的影响,通过用已有的心理测量学方法对人类的反应模式进行建模来估计难度,实验结果发现难度对于测试的结果有重要影响,同时易于学习的实例被模型学得更快。