Oct, 2018

交互式强化学习智能体自主行为解释

TL;DR本文提出了一种基于指令的行为解释(IBE)方法,它可以帮助人类理解机器学习机器人的行为,促进人机协作。IBE 允许代理自主获取表达来解释自己的行为,并通过重复使用人类专家给出的指令来加速代理政策的学习。IBE 还允许一个发展中的代理向人类解释其行为,以便在合作期间更好地进行沟通。