Jun, 2019
深度赌徒:使用投资组合理论学习戒赌
Deep Gamblers: Learning to Abstain with Portfolio Theory
Liu Ziyin, Zhikang Wang, Paul Pu Liang, Ruslan Salakhutdinov, Louis-Philippe Morency...
TL;DR本文提出了一种基于赌博翻倍率的损失函数,通过将原本的多分类问题转化成带有拒绝选项的问题,实现了在最佳数据覆盖率下的最佳性能。该损失函数不需要对模型推理算法或架构进行修改,可以有效地处理神经网络训练中的不确定性,同时在 SVHN 和 CIFAR10 数据集上实现了较强的结果。