Mar, 2024

智能体会做电子绵羊的梦吗?通过生成学习提高强化学习的泛化能力

TL;DR通过基于想象力的强化学习,使用梦境般的片段来训练策略,并通过生成扩增对非想象力、预测轨迹进行修改,实验表明与经典的想象力和脱机训练相比,我们的方法在处理收益稀疏环境时可以达到更高水平的泛化。