BriefGPT.xyz
Ask
alpha
关键词
generalized bellman equation
搜索结果 - 1
多目标强化学习和策略适应的广义算法
提出了一种基于广义 Bellman 方程的多目标强化学习算法,该算法可通过极少量的样本快速适应新任务并生成最优策略。
PDF
5 years ago
Prev
Next