BriefGPT.xyz
Ask
alpha
关键词
goal discovery
搜索结果 - 2
通过修剪原型目标扩展目标导向探索的规模
本研究基于强化学习,通过在人工设计产生的广泛目标空间中寻找可控、可达、新颖和相关目标的自主发现过程,弥补探索广域领域中新奇性和涵盖性行为不足的问题,并在三种具有挑战性的环境中证明了目标导向的探索的有效性。
PDF
a year ago
机器人操作中的自对称自我对弈用于自动目标发现
通过不对人类先验假设的依赖,我们可以通过非对称自我博弈的方法训练出只需稀疏奖励的 Bob,并且他可以从 Alice 的轨迹中学习,以实现目标发现和机器人操作的一体化控制。
PDF
3 years ago
Prev
Next