ICMLJun, 2020

FISAR:基于深度神经网络优化的前不变安全强化学习

TL;DR本文提出了一种基于深度神经网络优化器的约束优化求解方法,将约束作为 Lyapunov 函数并在策略参数更新动态上施加新的线性约束以达到约束满足的效果,并改进了现有方法在优化策略时的瓶颈,其在数值优化和避障导航等场景中体现了出色的性能。