BriefGPT.xyz
大模型
Ask
alpha
关键词
self-supervised rl
搜索结果 - 2
ACL
STARLING:基于大型语言模型的文本强化学习自监督训练代理
自动化游戏生成的 STARLING 环境为基于文本的强化学习代理提供了提升性能和泛化能力的能力,以通过与预定义任务集上的训练来提高代理的技能水平。
PDF
25 days ago
使用合成观测学习未来表示以提高效率的强化学习
通过丰富辅助训练数据,提出了一种无需训练的方法来合成可能包含未来信息的观察,从而改进了强化学习中的辅助表示学习,并展示了其在连续控制和基于无动作视频演示的视觉预训练中的先进性能。
PDF
a month ago
Prev
Next