BriefGPT.xyz
Ask
alpha
关键词
policy gradient extension
搜索结果 - 1
深度聚合:序列预测的可微分模仿学习
使用 Imitation Learning 的 Policy Gradient Extension 能够充分利用优秀的预测模型,在深度神经网络处理的机器人控制及序列预测任务上比弱化的 Reinforcement Learning 更高效、损
→
PDF
7 years ago
Prev
Next