Apr, 2023

高水平机器人解释的奖励分解探究

TL;DR本文提出利用抽象动作和奖励分解技术的可解释学习框架,使得机器人动作的解释更易于人类理解,并通过两个场景的定量和定性分析,展示了该框架的有效性。