BriefGPT.xyz
Ask
alpha
关键词
replay buffers
搜索结果 - 2
利用好奇心在连续离线强化学习中实现任务均衡表示
研究通过使用好奇心重播缓冲区的方法,改进离线多任务连续强化学习,当任务由环境中的非稳定性定义时,这些任务在时间上不是标记的且不均匀地展示给学习者。
PDF
7 months ago
连续自监督学习的挑战
本文研究了自我监督学习在连续流数据中的应用及其效率,提出了重放缓存与最小冗余样本的方法来增强学习。实验结果表明,这些方法可以有效提高表示学习的精度和鲁棒性,在非平稳的语义分布下也不容易出现灾难性遗忘。
PDF
2 years ago
Prev
Next