Oct, 2019
多任务深度神经分类器中的泛化问题:基于统计物理学的方法
Generalization in multitask deep neural classifiers: a statistical physics approach
Tyler Lee, Anthony Ndirango
TL;DR本论文通过应用无序系统的统计物理学技术,对解决使用 softmax 输出和交叉熵损失的分类任务的深度神经网络的推广进行非线性动力学的分析,以理论上支持多任务学习表现由任务的噪声性以及输入特征对其的对齐程度来决定的直觉。