AAAIDec, 2021

将人类反馈学习与知识工程相结合,在 Minecraft 中解决分层任务

TL;DR本文介绍了一种基于人类示范数据进行仿真学习的方法以及使用人类反馈来训练图像分类器的方法,将这些模块与估算的 Odometry 地图相结合,以自然层次结构利用人类知识的强大状态机,并将该混合智能方法与端到端机器学习和纯工程解决方案进行比较。