Feb, 2023

从局部纠正中学习操作方式

TL;DR该论文介绍了一种代理学习模型,在不同的上下文中学习行动执行方式,并利用试错和口头纠正来解决其领域级计划问题。