BriefGPT.xyz
Ask
alpha
关键词
behavioral priors
搜索结果 - 5
MyoDex: 灵巧操作的可推广先验
利用多任务学习模型和行为先验,研究人类灵巧性和机器人物理控制在各种接触丰富的行为中的学习和操作能力。
PDF
10 months ago
使用 RL 和基于记忆片段的行为先验进行规划
本文提出了一种规划方法,使用行为先验知识帮助增强学习中的有效探索和学习,表明探索策略形式的行为先验可以帮助代理更快地学习。
PDF
2 years ago
行为预期和动态模型:改进离线强化学习的性能和领域转移
本文提出了一种 Offline Model-based RL with Adaptive Behavioral Priors(MABE)算法,利用数据集的动力学模型和行为先验知识相结合,大大提高了离线 RL 策略的性能和泛化能力,在 D4R
→
PDF
3 years ago
道德故事:关于规范、意图、行动及其后果的情境推理
探究自然语言生成模型作为行为先验条件用于社交环境中行为的假设生成,结合 Moral Stories 数据集研究并提出解码策略,通过综合专家模型实现优质行为生成、后果和规范生成。
PDF
4 years ago
鹦鹉:数据驱动的强化学习行为先验
本论文提出了一种用于预训练行为先验的方法,以便捕捉先前看到的各种任务中观察到的复杂输入输出关系,并展示了如何使用这种学习到的先验以便快速学习新任务,有效地解决了具有挑战性的机器人操纵领域中的问题。
PDF
4 years ago
Prev
Next