ICMLApr, 2023

离线交互数据的距离加权监督学习

TL;DR该研究介绍了一个名为 DWSL 的距离加权监督学习方法,用于从线下数据中学习目标条件策略,通过加权行动以估计最短路径距离,能够在高维图像领域中超过先前的目标条件 IL 和 RL 算法的性能。