Jan, 2023

具有鲁棒性保障的安全增强学习的最优传输扰动

TL;DR本研究提出了一种基于最优传输成本不确定性集的安全强化学习框架,通过离线学习实现效率高、理论支持强的无需对数据收集过程进行过多假设的具有鲁棒性、安全性能的表现。在真实世界的强化学习套件中证明了该方法的优越性。