Mar, 2022

多尺度传感器融合和神经 CDE 的连续控制

TL;DR本文提出了一种新的方法 InFuser 来训练连续时间策略,通过积分和融合多传感器观察数据来推断出连续时间动作,以期获得更好的视觉 - 运动控制。行为克隆实验表明,InFuser 在动态任务中(例如将球挥入杯中)学习到了稳健的策略,并且在观察数据不均匀的情况下优于一些基线。