Aug, 2024

通过核函数逼近利用无标签数据共享在离线强化学习中的应用

TL;DR本研究解决了离线强化学习中标签数据成本高昂的问题,提出了一种利用无标签数据的方法。论文中介绍的算法基于核函数逼近,并提供了理论保证,展现了在标签数据有限时有效利用无标签数据的潜力,可能显著提升离线强化学习的效率。