Aug, 2023

通过虚拟风险最小化轻松实现模型泛化

TL;DR本文介绍了 Dummy Risk Minimization(DuRM)技术,一种简单易用的方法来提高 Empirical risk minimization(ERM)的广义性能,该方法通过扩大输出 logits 的维度并使用标准梯度下降进行优化,从理论和经验分析两个方面验证了 DuRM 的有效性,结论表明 DuRM 可以在各种任务中持续改善性能。