Jun, 2022

基于深度神经网络的 Sokoban 计划中左重尾的影响及其策略和价值网络的有效性

TL;DR通过将传统搜索方法与深度神经网络(DNN)相结合,对 Sokoban 进行了研究,发现 DNN 的策略和价值网络对于搜索具有出色的引导启发作用,特别是策略网络能够避免探索指数大小子树以实现左重尾的多项式缩放,因此随机重启在 DNN-based 搜索方法中也至关重要。