Jan, 2019

来自不完美演示的模仿学习

TL;DR本研究提出了使用置信度评分进行模仿学习,通过仅仅给予一小部分次优演示的置信度评分,有效地从次优演示中学习。此外,提出了两种基于置信度的模仿学习方法,即 2IWIL 和 IC-GAIL。理论和实证结果都表明,这些方法显著提高了模仿学习的性能。