BriefGPT.xyz
大模型
Ask
alpha
关键词
on-policy deep rl
搜索结果 - 1
关于策略深度强化学习中可塑性损失的研究
深度神经网络的持续学习面临着与固定数据集和凸连续学习模式不同的挑战,其中一个挑战是可塑性损失,即在线训练的神经网络显示出适应新任务的能力下降。本文通过一系列实验研究了深度增强学习中的可塑性损失和多种缓解方法,并发现在领域转移情况下可塑性损失
→
PDF
a month ago
Prev
Next