Jan, 2024

基于注意力的强化学习在组合优化中的应用:作业车间调度问题

TL;DR我们提出了一种基于注意力机制的强化学习方法来解决作业车间调度问题,通过将策略梯度强化学习与改进的 Transformer 架构相结合,我们的方法在解决大规模问题上表现优于最近的研究和广泛采用的启发式规则。