BriefGPT.xyz
Ask
alpha
关键词
goal distributions
搜索结果 - 1
DisCo RL: 面向通用策略的分布条件强化学习
本文提出了一种基于目标分布的通用任务表征方法,通过该方法可以实现针对不同任务的灵活重用技能,并开发了一种离策略算法 (Distribution-Conditioned Reinforcement Learning, DisCo RL) 来高
→
PDF
3 years ago
Prev
Next