BriefGPT.xyz
Ask
alpha
关键词
complex behaviors
搜索结果 - 5
ICML
因果作用感知的反事实数据增强
离线数据是教导机器人复杂行为的宝贵和实用资源。本文介绍了一种数据增广方法 CAIAC,可以在没有访问在线环境交互的情况下,从一个固定的数据集中创建可行的合成转换。通过利用量化因果影响的原则方法,我们能够通过在数据集中独立轨迹之间交换 “不受
→
PDF
a month ago
稳定的逆强化学习:控制 Lyapunov 景观的政策
通过学习专家示范来灵活地编程自主系统以实现复杂行为,或者预测代理行为是一个强大的工具,特别是在协同控制环境中。我们提出了一种新颖的稳定性认证逆优化奖励学习法,通过将代价函数推断问题重新表述为从示范数据中学习控制李亚普诺夫函数。我们利用闭合形
→
PDF
2 months ago
隐式行为克隆
在机器人策略学习中,使用隐式模型的监督策略学习通常表现更好,这种策略不需要奖励信息,可以学习复杂的行为,并能够在具有高度组合复杂性和毫米级精度要求的任务中学习人类示范的复杂行为。
PDF
3 years ago
通过放大弱专家的能力来辅助强学习者
本文介绍了一种名为迭代放大的训练策略,它通过组合解决较简单的子问题来有效地学习复杂行为,适用于包含难以明确目标的现实学习任务。
PDF
6 years ago
ICLR
多智能体竞争引发的紧急复杂性
本文介绍了几种在三维环境中进行竞争多智能体自我对抗训练的方法,这些方法可以训练出丰富多彩、技能复杂的智能体。此外,我们指出,自我对抗训练可以产生超出环境本身复杂性的行为,并且自带课程设置,有助于智能体学习不同难度水平下的技能。
PDF
7 years ago
Prev
Next