Jun, 2021

强化学习效率提升的因果影响检测

TL;DR本文研究如何通过对强化学习智能体在特定情况下的影响力进行测量,结合条件互信息将此度量值引入强化学习算法,提高机器人操作任务中的数据效率。