Feb, 2020

不变风险最小化博弈

TL;DR该研究提出使用不变风险最小化方法找到多个环境之间的纳什均衡来训练模型,从而降低伪相关性对模型的影响。通过用最佳反应动态来解决这个问题,该方法使得模型在保证泛化的同时提高了训练的稳定性。该算法为博弈论机器学习算法的成功案例之一。