Sep, 2023
再探能量模型作为策略:排序噪声对比估计和插值能量模型
Revisiting Energy Based Models as Policies: Ranking Noise Contrastive Estimation and Interpolating Energy Models
Sumeet Singh, Stephen Tu, Vikas Sindhwani
TL;DR通过引入排名噪声对比估计(R-NCE)、可学习的负采样器和非对抗联合训练等关键因素,我们证明了高维连续空间中能量模型在训练时并不是不切实际的,我们的训练算法使能量模型作为策略在多模态路径规划和有接触力量推动等难度较高的基准测试中与扩散模型和其他最先进方法相竞争甚至表现更好。