Dec, 2023

BSL:理解和改进用于推荐的 Softmax 损失函数

TL;DR通过理论分析我们发现 Softmax loss (SL) 的强大性能是由于对负数据分布进行了 Distributionally Robust Optimization (DRO),因此具有鲁棒性;相较于其他损失函数,SL 隐式地惩罚预测方差,从而得到更公平的结果。基于这些见解,我们进一步提出了一种新的损失函数 Bilateral SoftMax Loss (BSL),可以使模型对于噪声正例具有鲁棒性。值得一提的是,BSL 相较于 SL 只需添加一行代码即可实现。通过实验证明了我们提出的方法的有效性。