Oct, 2022

面向可定制化强化学习代理的在线词汇扩展:实现偏好规定

TL;DR本文提出了 PRESCA 系统,使用概念学习以及因果关联和数据增强等方法,让用户更轻松地通过概念来指定其对自动化代理的偏好,并在 Minecraft 环境中验证其有效性。