Jun, 2019

深度赌徒:使用投资组合理论学习戒赌

TL;DR本文提出了一种基于赌博翻倍率的损失函数,通过将原本的多分类问题转化成带有拒绝选项的问题,实现了在最佳数据覆盖率下的最佳性能。该损失函数不需要对模型推理算法或架构进行修改,可以有效地处理神经网络训练中的不确定性,同时在 SVHN 和 CIFAR10 数据集上实现了较强的结果。