Oct, 2021

提高TSP求解器泛化能力的博弈论方法

TL;DR利用基于PSRO(Policy Space Response Oracle)方法的两人零和博弈进行深度学习解算器的泛化能力提升,实现在不同的TSP任务中最大程度的通用性表现,最终实现了解算器人口的效用降低和达到Nash均衡。