Nov, 2023

金融时间序列的无模型控制的课程学习与模仿学习

TL;DR课程学习和模仿学习在机器人领域得到广泛应用,但对于基于高度随机时间序列数据的控制任务,研究工作较少。本研究通过数据增广实现了课程学习的基本思想,通过策略提炼从模型中学习实现了模仿学习,并发现课程学习可以提高复杂时间序列控制任务的性能,这一发现对于时间序列控制的课程学习非常鼓舞人心。然而,我们发现模仿学习需要谨慎使用。