BriefGPT.xyz
Ask
alpha
关键词
neural subtask graph solver
搜索结果 - 1
分层强化学习用于具有子任务依赖性的零样本普适性
提出了一种新的强化学习问题,该问题需要代理在一个由子任务图描述的先前未见的环境中进行泛化,我们提出了一种神经子任务图求解器,通过使用递归神经网络嵌入来编码子任务图,并用基于梯度的策略,图奖励传播来预训练它,进一步通过演员 - 评论家方法微调
→
PDF
6 years ago
Prev
Next