ICLRSep, 2021

学习超优化现实世界程序

TL;DR本文提出了一种使用神经序列到序列模型来学习超级优化现实世界程序的框架,并介绍了一种易于实现的方法(SILO)来增强优化,该方法在测试集上优化了 5.9%,超过了标准策略梯度方法和模型预训练的优化演示。