BriefGPT.xyz
大模型
Ask
alpha
关键词
temporal disentanglement
搜索结果 - 1
ICLR
强化学习中的表示时间解耦以提高泛化能力
通过引入时间分离(TED)作为强化学习辅助任务,可以更好地利用序列化 RL 观察结果,学习更健壮的表示形式,从而使 RL 算法对未知环境变量的变化更快地适应。
PDF
2 years ago
Prev
Next