Nov, 2022

利用学习奖励函数自动评估挖掘机操作员

TL;DR本文研究使用自动化评估和强化学习在高昂的人工成本下教授挖掘机操作,包括考虑内部动态、安全标准和仿真环境中的学习策略,以实现更安全的操作。