Feb, 2024

扩散遇到 DAgger:增强视觉手眼协调模仿学习

TL;DR为了解决在执行过程中模拟训练策略中的错误累积问题,本研究提出了一种不需要昂贵代价的 Diffusion Meets DAgger(DMD)方法,利用扩散模型生成能够覆盖分布外状态的样本,从而实现从少量示范中获得稳健性能,实验证明 DMD 比基于 NeRF 的增强方案提高了 50% 的性能。