Dec, 2023

通过想象行为修改强化学习策略:可预测的策略如何帮助用户完成新任务

TL;DR用户使用强化学习机器人的功能来创造性地解决问题非常重要,本文提出了Imaginary Out-of-Distribution Actions(IODA)算法,以解决用户使用机器人行为知识完成新任务时遇到的问题。