Oct, 2023

纯净演示中的模仿学习

TL;DR基于扩散过程的两步纯化方法,通过引入噪声消除了不完美展示中的潜在扰动,并从扩散后的数据中恢复出最优的专家展示,评估结果表明方法的有效性.