Sep, 2019

L_DMI:一种信息论噪声鲁棒损失函数

TL;DR本文提出一种新的信息论损失函数 L_DMI,其核心思想是一个广义版本的互信息算法 DMI,该损失函数可用于对深度神经网络进行标签噪声训练,不受噪声模式影响,具有理论保证,并能直接应用于现有分类神经网络。使用 L_DMI 在包括 Fashion-MNIST、CIFAR-10、Dogs vs. Cats、MR 等图像数据集和自然语言数据集以及真实数据集 Clothing1M 的各种合成噪声模式和噪声量下的分类任务中优于所有其他对手。