Mar, 2022

关于使用概率神经网络进行异方差不确定性估计的陷阱

TL;DR该论文对深度学习中估计异方差高斯分布参数的常见方法进行了研究,并提出了一种称为β-NLL的替代方法,该方法可以减轻基于梯度的优化器与对数似然函数损失函数一起使用时产生的困难。该替代方法在不同领域和任务中都表现出可观的改进和更具鲁棒性,这在预测RMSE和对数似然度量标准方面得到验证。