Feb, 2019

一种基于重要性采样的随机无导数优化方法:理论与学习控制

TL;DR本文提出了首个具有重要性采样的导数无关优化方法,并针对非凸、凸和强凸函数推导出新的改进的复杂性结果。作者进行了大量实验,证实该算法在高维连续控制问题中具有实用性。