Jun, 2024

开放问题:基于核强化学习的次优遗憾界

TL;DR强化学习在各种应用领域取得了很大的实证成果。本文探讨了强化学习在非线性函数逼近方面的理论问题,并提出了性能保证的挑战。