BriefGPT.xyz
大模型
Ask
alpha
关键词
environment variations
搜索结果 - 3
教机器人钓鱼:从一分钟演示中学习多功能模仿
FISH is a versatile imitation learning approach that can achieve an average success rate of 93% on robotic tasks by comp
→
PDF
a year ago
ICML
用综合专业学习提高政策优化
本文提出了一种新的强化学习通用 - 专业训练框架,通过辅助奖励和权重克隆的方式,将先前的训练经历分为 “通用训练” 和 “专业训练”,以在不同环境下实现最佳政策学习。
PDF
2 years ago
机器人基于离线数据的终身学习中的遗忘和不平衡问题
本文介绍了在生命周期内,机器人应该如何快速适应不断变化的环境,在强化学习领域下提出了离线蒸馏管道算法,解决了传统算法在新旧环境中表现的困境以及在多种环境中训练数据失衡等问题,并通过模拟仿生机器人步行任务的实验进行了检验。
PDF
2 years ago
Prev
Next