Mar, 2024

利用先验领域知识在采样过程中主动学习动力学

TL;DR我们提出了一种主动学习算法,通过将先验领域知识明确纳入采样过程,利用副信息来学习动态。通过数值实验,我们证明了该策略探索了高差异区域,加速了学习过程同时降低了模型不确定性。我们还通过提供最大预测方差的收敛速度的明确速率,严格证明了我们的主动学习算法给出了底层动态的一致估计。我们在一个欠驱动的摆系统和半猎豹 MuJoCo 环境上展示了我们方法的有效性。