BriefGPT.xyz
Ask
alpha
关键词
worker module
搜索结果 - 1
用于分层强化学习的封建网络
介绍了一种新的分层强化学习方法,即 FeUdal Networks,该方法采用 “管理者 - 工作者” 框架,在不同的时间分辨率上进行端到端的学习,以完成由管理者设定的抽象目标,并且旨在解决长时间跨度的信用分配问题,并在 ATARI 和 D
→
PDF
7 years ago
Prev
Next