Feb, 2019
一种基于重要性采样的随机无导数优化方法:理论与学习控制
A Stochastic Derivative-Free Optimization Method with Importance Sampling: Theory and Learning to Control
Adel Bibi, El Houcine Bergou, Ozan Sener, Bernard Ghanem, Peter Richtárik
TL;DR本文提出了首个具有重要性采样的导数无关优化方法,并针对非凸、凸和强凸函数推导出新的改进的复杂性结果。作者进行了大量实验,证实该算法在高维连续控制问题中具有实用性。