BriefGPT.xyz
Ask
alpha
关键词
final performance
搜索结果 - 1
可微分物理学的模仿学习
本文提出了一种新的基于可微分物理仿真器的模仿学习方法 (ILD),该方法将物理预设作为先验加入到计算图中进行策略学习,在优化过程中动态选择每个状态的学习目标,实现了单循环结构,提高了稳定性和训练速度。在验证中,ILD 在连续控制任务和变形物
→
PDF
2 years ago
Prev
Next