ICLROct, 2018

学习模拟

TL;DR本研究提出了一种基于强化学习的方法,用于自动调整非可微模拟器的参数,从而控制合成数据的分布以最大化模型的精度,相较于现有技术,该方法全面控制模拟器以最大化精度。