Feb, 2024

基于插值的策略扩散行为细化

TL;DR这篇论文通过使用信息源策略,提出了一种名为 BRIDGER 的方法,在模仿学习任务中优于现有的扩散策略,并在设计方面进行了进一步分析。