BriefGPT.xyz
Ask
alpha
关键词
imperfect demonstrations
搜索结果 - 2
ICML
如何在离线模仿学习中利用多样化的示范
离线仿真学习(IL)在实际领域中由于专家数据的稀缺性而受到越来越多的关注。本文介绍了一种简单而有效的数据选择方法,基于其结果状态识别积极行为,从而更好地利用动态信息并有效地提取专家行为和有益的多样行为。通过在复杂和高维离线 IL 基准测试中
→
PDF
a month ago
纯净演示中的模仿学习
基于扩散过程的两步纯化方法,通过引入噪声消除了不完美展示中的潜在扰动,并从扩散后的数据中恢复出最优的专家展示,评估结果表明方法的有效性.
PDF
9 months ago
Prev
Next