Jun, 2024

模拟、快慢学习:学习黑箱优化的策略

TL;DR通过学习主动学习策略和使用代理模型的梯度从而使用梯度下降法优化模拟参数,本文引入了一种新的方法来解决类似黑盒优化问题的一类问题。经过训练后,相对于局部代理模型方法、数值优化和贝叶斯方法,基于黑盒模拟器的问题的下游优化仅需要约 90%较少的昂贵模拟调用。