学习模拟

ICLROct, 2018

Learning To Simulate

Nataniel Ruiz, Samuel Schulter, Manmohan Chandraker

TL;DR本研究提出了一种基于强化学习的方法，用于自动调整非可微模拟器的参数，从而控制合成数据的分布以最大化模型的精度，相较于现有技术，该方法全面控制模拟器以最大化精度。

Abstract

simulation is a useful tool in situations where training data for machine learning models is costly to annotate or even hard to acquire. In this work, we propose a reinforcement learning-based method for automati

simulation reinforcement learning synthesized data accuracy parameter control

发现论文，激发创造

AutoSimulate:（快速）学习合成数据生成

通过一种新的可微分逼近目标的方法，提出了一种有效的用于生成最优合成数据的替代方法，该方法可通过优化非可微模拟器，在每个迭代中仅需一个目标评估带有小的开销，在真实测试数据集上可以以较少的训练数据生成更快的理想数据分布（高达 50 倍）并具有更高的准确率（+ 8.7％），比以前的方法更好地解决了模拟机器学习算法中大型标记数据集的生成问题。

Aug, 2020

利用机器学习解决物理系统模拟中的计算难题

本研究提出了一个基于机器学习的数据生成框架，旨在辅助那些利用模拟来研究各种物理系统或过程的研究人员。我们的方法包括两个步骤：首先，我们使用有限的模拟数据训练监督预测模型来预测模拟结果；然后，我们使用强化学习代理来生成准确的、类似于模拟的数据，从而更有效地探索参数空间并深入了解物理系统或过程。我们通过两个案例研究：一个关注地震破裂物理，另一个关注新材料开发，证明了所提出框架的有效性。

May, 2023

基于仿真的强化学习在自主驾驶中的应用

采用强化学习和模拟技术开发驾驶系统，使用合成数据进行训练并验证了其在真实道路环境中的稳健性与有效性。

Nov, 2019

DriveGAN：朝着可控的高质量神经仿真

通过使用机器学习，该研究提出了一种能够通过观察图像数据和相关动作对来学习环境行为并进行建模的高质量神经模型，称为 DriveGAN，不需要监督信号训练控制模型，并在多个数据集上进行了训练和测试，表现优于之前的数据驱动模拟器，实现了对场景和非玩家对象的各个方面进行控制的新功能。

Apr, 2021

带有并行可微模拟的加速策略学习

本文提出 SHAC 算法，该算法基于高性能可微分模拟器，可以有效利用模拟梯度，避免局部最小值问题，并通过截断学习窗口来避免梯度消失或爆炸。在控制任务中表现出更高的样本效率和更短的训练时间。

Apr, 2022

自监督适应深度神经网络实现机器人视觉操作

使用深度强化学习隐式地在仿真环境中学习潜在的状态表示，并通过无标签的真实机器人数据将其调整到真实环境中，以实现从像素中执行操作任务。通过序列自监督目标优化对比正向动力学损失，提出了一种更加有效的方法，成功地训练基于视觉的强化学习智能体来堆叠方块。

Oct, 2019

RL-CycleGAN: 强化学习感知的模拟到真实领域的对抗生成网络

本论文提出了基于深度神经网络的强化学习在机器人抓取任务中的应用，以及利用生成模型进行图像仿真与真实环境之间的过渡。其中引入了 RL-scene 一致性损失用于图像翻译，可保证翻译操作是不变的，并在实现无监督领域转换的同时，训练出了 RL-CycleGAN 模型，该模型表现出了模拟到现实环境下最优的效果。

Jun, 2020

模拟、快慢学习：学习黑箱优化的策略

通过学习主动学习策略和使用代理模型的梯度从而使用梯度下降法优化模拟参数，本文引入了一种新的方法来解决类似黑盒优化问题的一类问题。经过训练后，相对于局部代理模型方法、数值优化和贝叶斯方法，基于黑盒模拟器的问题的下游优化仅需要约 90％较少的昂贵模拟调用。

Jun, 2024

通过模拟实现泛化：将模拟和真实数据集成到基于视觉的无人机深度强化学习中

本文提出一种深度强化学习算法，将模拟数据和真实世界数据相结合，通过学习机器的动力学和建立一个可扩展的感知系统，让四旋翼机器人仅凭单目相机避免碰撞，并在各种光线和几何条件下，用一个小时的真实世界数据就能在新环境中避免碰撞。

Feb, 2019

从模拟中学习驾驶技能，无需真实世界标签

该论文研究基于模拟的无人驾驶视觉导航系统，探讨了如何通过图像转换实现域间转换并在农村和城市道路上对自闭车的驾驶性能进行评估。

Dec, 2018