Nov, 2023

利用潜在空间搜索的组合优化与策略适应

TL;DR使用强化学习构建基于启发式方法的优化算法,通过预训练具有多样性的策略分布来优化搜索过程,在三个经典问题上实现了更好的性能和泛化能力。