Nov, 2023

领域随机化通过最大化熵

TL;DR通过在模拟中自动调节动力学分布而无需真实世界数据,我们提出了 DOmain RAndomization via Entropy MaximizatiON (DORAEMON) 方法,该方法通过增加采样动力学参数的多样性来提高自适应性和泛化能力,并在未知真实参数下成功进行零 - shot 迁移最大化目标任务的解决。