Mar, 2022

稀疏奖励环境下的品质多样化算法学习

TL;DR本文介绍了一种新颖的通过解决奖励稀疏性问题的算法,即 Novelty Search,探讨了如何用 Quality-Diversity Methods 来解决这个问题,尝试提出了一种利用 AutoEncoder 学习低维度搜索空间表示的 TAXONS 算法以及能够高效地聚焦于感兴趣的搜索空间部分的 SERENE 算法。