Apr, 2023

对抗生成神经进化控制行为模仿

TL;DR本研究探索深度神经进化算法是否可用于行为模仿,通过引入一个简单的对抗生成框架,将深度递归网络进化到可以在 8 个 OpenAI Gym 状态控制任务上模仿最先进的预训练代理的能力。实验结果表明,神经进化在生成行为模拟代理方面具有很大的潜力,可以使其在准确度和泛化性方面更具可操作性。