Mar, 2024

通过模拟对实际现实进行调和:一种用于强大操纵的实际到模拟到实际的方法

TL;DR通过模拟环境构建数字双子,提出了一种通过强化学习来增强真实世界模仿学习策略的系统 RialTo,实现高性能、鲁棒性的策略的学习,同时避免大量不安全的真实数据收集和大量人工监督。