Oct, 2024

可扩展的核逆优化

TL;DR本研究解决了逆优化中目标函数学习的不足,提出了一种基于再生核希尔伯特空间(RKHS)的新方法,增强了特征表示能力。通过引入序列选择优化(SSO)算法,实现了对核逆优化模型的有效训练,并在MuJoCo基准上验证了该模型的推广能力和SSO算法的有效性。