Jun, 2020

同时学习具有已知转移的随机和对抗式连续决策问题

TL;DR研究如何使用该算法在 stochastic losses 和 adversarial losses 的情况下同时获得最佳表现,并提出了一种新的混合正则化器,它基于 Zimmert 等人(2019a、2019b)的最新工作 ,但对于对角线海森矩阵逆运算比较复杂。