BriefGPT.xyz
Ask
alpha
关键词
visual demonstrations
搜索结果 - 4
基于引导对比学习的观察模仿
本文提出了基于视觉演示的学习控制策略的一种 IfO 算法,名为 BootIfOL,该算法旨在学习一种从智能体轨迹到目标轨迹的距离度量方式,通过对比学习训练出智能体控制策略,实验结果表明该算法可以在有限的演示轨迹上训练出有效的策略。
PDF
a year ago
使用变分模型的视觉对抗性模仿学习
该论文介绍了一种使用固定数据集的视觉演示来学习如何完成任务的方法,并提出了一种基于变分模型的对抗性模仿学习算法来处理高维空间、固定奖励等挑战,实验结果表明 V-MAIL 算法能够高效稳定地学习成功的视觉动作策略。
PDF
3 years ago
基于模型的视觉演示逆强化学习
本文介绍了一种基于梯度的反向强化学习框架,利用预训练的视觉动态模型从视觉人类演示中学习成本函数,并通过视觉模型预测控制来复制演示行为,以解决机器人操作中的未知动力学等问题。我们在两个基本的对象操作任务上评估了我们的框架。
PDF
4 years ago
CVPR
通过叙述式示范进行奖励学习
该研究提出了一种联合学习自然语言基础和可教授行为策略的方法,并使用叙述视觉演示(NVD)对其进行监督。通过将指导者描述映射到感知奖励探测器,训练对应的行为策略。通过实验表明,具有自然语言指导的可教授代理人可以在测试时执行涉及新对象和新位置的
→
PDF
6 years ago
Prev
Next