AAAIFeb, 2021

强化学习中的度量和连续性

TL;DR本文通过介绍度量学和邻域的形式表述,建立了各种相似度度量之间的层次结构,并研究了这些度量的理论性质和在强化学习问题上的应用,同时结合实验结果,进一步探讨了这些度量方法的差异。