Jun, 2023

从扩散模型中提取奖励函数

TL;DR本文提出使用扩散模型和奖励函数相结合的方式,在序列化决策任务中实现高效决策,使用神经网络参数化奖励函数,能够提高机器人的运动性能,并且可以推广到图像生成领域。