Aug, 2019

使用动作建议优化 Minecraft 中的深度强化学习

TL;DR使用交互式机器学习可以帮助训练具有复杂行为的深度强化学习智能体,但需要在人类教师的努力和代理性能之间实现平衡。本研究探讨了两种强化学习算法在具有视觉混淆的情况下,通过人类动作建议来提高代理性能、评估动作建议类型的潜在认知负荷以及提高训练效率和抵御错误建议的能力。