Aug, 2020

实时规划的高样本利用率交叉熵方法

TL;DR本文提出了改进的 CEM 算法,包括时间相关动作和内存等创新性的增加,可以在高维控制问题中使用,减少了采样次数并提高了 1.2-10 倍的性能表现。