ICMLMar, 2020

强化学习中的分布鲁棒性和正则化

TL;DR本文介绍了一种新的 Wasserstein 分布强化学习框架,并将其与正则化相联系,从而为解决强化学习中的外部不确定性问题提供一个新的实用工具。