Mar, 2017

使用时间段模型的预测与控制

TL;DR介绍了一种基于深度生成模型的学习方法,能对非线性系统的动态进行变化预测,针对碰撞、感官噪声和动作延迟进行了建模,并用于基于模型的策略优化。