BriefGPT.xyz
大模型
Ask
alpha
关键词
skill repertoires
搜索结果 - 4
层次化品质多样性用于在线损伤恢复
介绍了分层试错算法,使用分层行为复述学习各种技能并利用这些技能使机器人更适应不同情况。实验表明,与最佳基线相比,我们的方法在迷宫导航任务中需要的行动次数少 20%,而完全失败的通常情况下减少 57%。
PDF
2 years ago
动态感知的多样性优化:高效学习技能库
通过使用动态模型来提高质量 - 多样性算法的样本效率,我们提出了动态感知质量 - 多样性 (DA-QD) 框架;我们从中获得的经验进行增量训练,可以在想象力中使用想象技能库进行质量 - 多样性探索。该方法能够在三个机器人实验中取得成功的应用
→
PDF
3 years ago
想象目标的视觉强化学习
介绍了一种通过结合无监督表示学习和强化学习来获得一般技能库的算法,可以处理原始感官输入(如图像),并使用后期目标重新标记方案来进一步提高其方法的样本效率,在实际机器人系统上获得了比之前的技术更好的效果。
PDF
6 years ago
具有自动课程学习特性的内在动机目标探索过程
本论文提出了一种基于内在动机的目标探索算法,结合自主学习过程和增量式目标策略搜寻探索,可以自动生成任务序列并发掘多种技能,无需特定的目标指令,适用于机器人等人工智能设备的自主发展学习。
PDF
7 years ago
Prev
Next