BriefGPT.xyz
Ask
alpha
关键词
continual domain shifts
搜索结果 - 1
应对生涯强化学习中非稳态性的反应性探索
该论文探讨了在终身学习的情境下如何跟踪和适应持续的领域转变,为此提出了反应式探索方法,并基于实验证明,策略梯度方法是适合于终身学习的一种学习方法,能更快地适应分布变化。
PDF
2 years ago
Prev
Next