Nov, 2023

CLIP-Motion:使用连续观测学习机器人动作的奖励函数

TL;DR利用基于 CLIP 的模型学习机器人运动的奖励函数的新方法,回避了传统奖励函数设计中的挑战,通过利用 CLIP 处理状态特征和图像输入的能力,准确识别连续观察之间的运动并增强机器人领域的强化学习培训。