AAAIMar, 2022

NovGrid: 评估智能体对新颖性响应的灵活网格世界

TL;DR研究提出了一种新奇性改进的强化学习方法,针对具有改变环境机制 / 属性的新奇性,提出了 NovGrid 框架及其本体,以及可以应用于 MiniGrid 兼容环境的新奇性模板,并通过内置度量指标评估了基线强化学习模型的特征。