Jul, 2023

强化学习中的稳定边缘现象研究

TL;DR通过研究强化学习中的稳定性边界现象,发现优化动力学可以在不同的问题领域中发生转移,但深度强化学习的优化动力学在某些方面与监督学习不同。