BriefGPT.xyz
Ask
alpha
关键词
simulation-based training
搜索结果 - 3
AAAI
基于非匹配生成模型的稳健马尔可夫决策过程的策略学习
利用模拟器训练代理人以学习强健的策略是解决医疗、自动驾驶等高风险环境下数据实验不可行的问题。本篇研究以生成模型的形式将训练环境表达,并提出了一种基于博弈论的算法解决了在测试中出现的扰动与环境不确定性的问题,得到了一个近似最优的强健决策。
PDF
2 years ago
学习普通微分方程的神经事件函数
将神经常微分方程 (Neural ODE) 扩展到使用由神经事件函数表示的隐式终止标准来建模离散和瞬时连续时间系统的改变,对切合动态系统和多体系统中的碰撞建模并提出基于模拟的点过程训练方法。
PDF
4 years ago
IJCAI
利用神经网络进行对抗生成的实时反馈,用于基于仿真的训练
本文提出了一个基于神经网络和对抗技术的实时反馈生成方法,通过有界对抗更新和反向传播最小化 L1 正则化损失,实现了高效且有效的反馈生成,相比现有方法具有更高的效力和效率,在模拟训练领域具有广泛的应用前景。
PDF
7 years ago
Prev
Next