BriefGPT.xyz
Ask
alpha
关键词
latent dynamics model
搜索结果 - 5
通过即时状态条件的动作抽象实现高效蒙特卡罗树搜索
基于组合结构的行为抽象可以提高蒙特卡洛树搜索在具有复杂动作空间问题上的效率。本研究通过学习一个潜在的动态模型和辅助网络,构建了一种状态条件行为抽象方法,用于减少搜索空间并提高采样效率,并在实验中展示了其比传统 MuZero 方法更好的采样效
→
PDF
a month ago
SculptBot: 三维可变形物体操纵的预训练模型
通过使用点云作为状态表示并利用预训练的点云重建 Transformer 学习潜在动力学模型,我们提出了一种系统来解决可变形物体操纵中的挑战,进而应用于机器人雕塑任务。我们设计了一种新颖的动作采样算法,通过推理点云之间的几何差异进一步提高了基
→
PDF
10 months ago
通过不变分解和 (时空) 转换器学习潜在动态
提出了一种方法,通过在一种框架内结合变分自动编码器和 (时空) 注意力机制,从高维经验数据中学习动力系统,以实现确定一定科学动力学不变的设计,这种方法允许在任何连续时刻有效推断系统行为,是从异构数据中高效学习动态模型的一种有前途的新框架。
PDF
a year ago
简化的时间一致增强学习
本文展示了一种简单的表示学习方法:只依赖于通过潜在时间一致性训练的潜在动态模型,既可以在计划类的强化学习中使用,也可以在基于模型的强化学习中作为策略和价值函数特征使用。该方法在高维度任务上优于模型无关方法,并在样本效率上达到了模型类方法的水
→
PDF
a year ago
从像素学习潜在动力学规划
通过图像学习环境动态、通过快速在线规划选择动作,利用深度计划网络(PlaNet)解决了连续控制任务中的挑战,同时使用的强度模型相对较少。
PDF
6 years ago
Prev
Next