Jan, 2023

NeSIG: 一种神经符号方法用于学习生成规划问题

TL;DR本文提出了一种名为 NeSIG 的新的领域无关方法,用于自动生成符合条件的、多样的、难以解决的规划问题,将问题生成视为马尔可夫决策过程,并用深层强化学习来训练两个生成策略,实验在几种经典领域进行,结果表明 NeSIG 能够自动生成更难以解决且多样的有效问题。