May, 2023

一种轻量级的 CNN-Transformer 模型用于学习旅行商问题

TL;DR本研究提出了一种基于 CNN 嵌入层和局部自注意力的轻量级 CNN-Transformer 模型,相对于标准 Transformer 模型,该模型能够更好地从输入数据中学习空间特征,同时通过局部自注意力减少全连接注意模型中的冗余性。实验结果表明,我们提出的模型在解决 TSP 问题的质量、GPU 内存使用和推理时间等方面优于其他最先进的 Transformer-based 模型。