学习模拟
通过一种新的可微分逼近目标的方法,提出了一种有效的用于生成最优合成数据的替代方法,该方法可通过优化非可微模拟器,在每个迭代中仅需一个目标评估带有小的开销,在真实测试数据集上可以以较少的训练数据生成更快的理想数据分布(高达 50 倍)并具有更高的准确率(+ 8.7%),比以前的方法更好地解决了模拟机器学习算法中大型标记数据集的生成问题。
Aug, 2020
本研究提出了一个基于机器学习的数据生成框架,旨在辅助那些利用模拟来研究各种物理系统或过程的研究人员。我们的方法包括两个步骤:首先,我们使用有限的模拟数据训练监督预测模型来预测模拟结果;然后,我们使用强化学习代理来生成准确的、类似于模拟的数据,从而更有效地探索参数空间并深入了解物理系统或过程。我们通过两个案例研究:一个关注地震破裂物理,另一个关注新材料开发,证明了所提出框架的有效性。
May, 2023
通过使用机器学习,该研究提出了一种能够通过观察图像数据和相关动作对来学习环境行为并进行建模的高质量神经模型,称为 DriveGAN,不需要监督信号训练控制模型,并在多个数据集上进行了训练和测试,表现优于之前的数据驱动模拟器,实现了对场景和非玩家对象的各个方面进行控制的新功能。
Apr, 2021
本文提出 SHAC 算法,该算法基于高性能可微分模拟器,可以有效利用模拟梯度,避免局部最小值问题,并通过截断学习窗口来避免梯度消失或爆炸。在控制任务中表现出更高的样本效率和更短的训练时间。
Apr, 2022
使用深度强化学习隐式地在仿真环境中学习潜在的状态表示,并通过无标签的真实机器人数据将其调整到真实环境中,以实现从像素中执行操作任务。通过序列自监督目标优化对比正向动力学损失,提出了一种更加有效的方法,成功地训练基于视觉的强化学习智能体来堆叠方块。
Oct, 2019
本论文提出了基于深度神经网络的强化学习在机器人抓取任务中的应用,以及利用生成模型进行图像仿真与真实环境之间的过渡。其中引入了 RL-scene 一致性损失用于图像翻译,可保证翻译操作是不变的,并在实现无监督领域转换的同时,训练出了 RL-CycleGAN 模型,该模型表现出了模拟到现实环境下最优的效果。
Jun, 2020
通过学习主动学习策略和使用代理模型的梯度从而使用梯度下降法优化模拟参数,本文引入了一种新的方法来解决类似黑盒优化问题的一类问题。经过训练后,相对于局部代理模型方法、数值优化和贝叶斯方法,基于黑盒模拟器的问题的下游优化仅需要约 90%较少的昂贵模拟调用。
Jun, 2024
本文提出一种深度强化学习算法,将模拟数据和真实世界数据相结合,通过学习机器的动力学和建立一个可扩展的感知系统,让四旋翼机器人仅凭单目相机避免碰撞,并在各种光线和几何条件下,用一个小时的真实世界数据就能在新环境中避免碰撞。
Feb, 2019