May, 2024

游戏过滤器:安全机器人在对抗想象中行走

TL;DR通过离线博弈强化学习,用于合成高度鲁棒的安全过滤器以实现腿式机器人在不确定的、新颖环境中的安全操作。