BriefGPT.xyz
Ask
alpha
关键词
conflicting requirements
搜索结果 - 1
受约束强化学习具有零对偶间隙
本文针对自主制约智能方面存在的困境进行研究,主要研究如何应用 Primal-Dual 方法使其具有收敛性。通过探究多目标收益函数,多目标学习和多目标值函数相结合等方法的局限性,提出 Primal-Dual 算法。与其他算法不同,本方法可以在
→
PDF
5 years ago
Prev
Next