BriefGPT.xyz
大模型
Ask
alpha
关键词
plasticity loss
搜索结果 - 5
关于策略深度强化学习中可塑性损失的研究
深度神经网络的持续学习面临着与固定数据集和凸连续学习模式不同的挑战,其中一个挑战是可塑性损失,即在线训练的神经网络显示出适应新任务的能力下降。本文通过一系列实验研究了深度增强学习中的可塑性损失和多种缓解方法,并发现在领域转移情况下可塑性损失
→
PDF
a month ago
我们是否可以通过神经崩溃来理解可塑性?
本文探讨深度学习中两个最近发现的现象之间的联系:可塑性损失和神经崩溃。我们分析了它们在不同场景中的相关性,揭示了在第一任务的初始训练阶段存在显著关联。此外,我们介绍了一种规范化方法来减轻神经崩溃,证明了它在这种特定情况下减缓可塑性损失的有效
→
PDF
3 months ago
重置与精炼:克服连续强化学习中的负迁移的方法
通过实验证明 CRL 中的负迁移问题无法通过最近的一些减轻 RL 损失的研究成果来有效解决,所以我们提出了 Reset & Distill (R&D) 方法来克服 CRL 中的负迁移问题,该方法通过重置代理的在线演员和评论网络以学习新任务,
→
PDF
4 months ago
解析神经网络可塑性丧失的原因
在神经网络的设计、初始化和优化的过程中,损失可塑性问题是一个关键因素。通过组合使用层归一化和权重衰减技术,可以在各种非平稳学习任务中有效地维持网络的可塑性,从而实现高度稳健的学习算法。
PDF
4 months ago
重访视觉强化学习中的可塑性:数据、模块和训练阶段
基于神经网络的高性能、高效样本视觉增强强化学习的主要研究领域之一是塑性。本研究通过系统性实证研究揭示了数据增强、评论者的塑性损失、塑性恢复等关键组成部分对塑性的影响,并提出了一种基于评论者塑性水平动态调整回放率来解决高回放率困境的策略,该策
→
PDF
9 months ago
Prev
Next