Apr, 2023

Roll-Drop:用单参数解决观测噪声的计算

TL;DR本文提出一种名为 Roll-Drop 的深度强化学习(DRL)的简单策略,通过在模拟期间使用 dropout 来考虑观察噪声,而不需要为每个状态显式地建模其分布。我们演示当将高达 25%的噪声注入观测后,成功率达到 80%,其鲁棒性比基线提高了一倍。在实际机器上部署受过训练的控制器并评估了所述的改进鲁棒性。