BriefGPT.xyz
Ask
alpha
关键词
wasserstein inverse reinforcement learning
搜索结果 - 2
Wasserstein 逆强化学习在多目标优化中的仿真证明
本文证明了 Wasserstein 反向强化学习可以在有限次迭代中实现学习者的奖励值模仿专家的奖励值,同时可在多目标优化中,实现学习者的最优解的字典序问题模仿专家的最优解。
PDF
a year ago
多目标优化的逆强化学习收敛证明
对于多目标优化问题,我们用射影次梯度方法展示了 Wasserstein 逆强化学习(WIRL)的收敛性,通过将优化问题的逆问题形式化为等价于多目标优化的 WIRL。此外,我们证明了逆强化学习(最大熵逆强化学习,引导成本学习)在使用射影次梯度
→
PDF
a year ago
Prev
Next