Nov, 2023

ADAPTER-RL:使用强化学习对任意代理进行自适应

TL;DR深度强化学习代理人在适应训练分布之外的任务时面临着过拟合、灾难性遗忘和样本效率问题。本文探讨了适配器在强化学习中的应用,提出了一种创新的适应策略,在 nanoRTS 环境中实验,提高了训练效率并改进了基础代理人,同时兼容预训练神经网络和基于规则的代理人,提供了融合人类专业知识的方法。