Mar, 2025

HASARD:基于视觉的安全强化学习的基准测试在具身智能体中的应用

TL;DR本研究解决了现有基于视觉的3D基准仅考虑简单导航任务的不足,通过引入多样化和复杂的任务套件HASARD,以促进安全强化学习的应用。HASARD提供不同难度级别和行动空间的任务,以评估和提升智能体在复杂环境中的安全决策能力和空间理解能力,为未来的安全强化学习方法开辟了新的研究方向。