BriefGPT.xyz
Ask
alpha
关键词
feasible rewards for i-curl
搜索结果 - 1
逆凹效用增强学习即逆博弈论
我们提出了新的逆反强化学习问题的理论框架,将 concave function 应用于 CURL,并创造性地将其等效于 mean-field games 的逆博弈理论问题,从而揭示了 CURL 问题与传统逆强化学习不同的特性和挑战。
PDF
a month ago
Prev
Next