BriefGPT.xyz
Ask
alpha
关键词
base-agent improvement
搜索结果 - 1
ADAPTER-RL:使用强化学习对任意代理进行自适应
深度强化学习代理人在适应训练分布之外的任务时面临着过拟合、灾难性遗忘和样本效率问题。本文探讨了适配器在强化学习中的应用,提出了一种创新的适应策略,在 nanoRTS 环境中实验,提高了训练效率并改进了基础代理人,同时兼容预训练神经网络和基于
→
PDF
8 months ago
Prev
Next