Mar, 2024

进化变换器:基于上下文的进化优化

TL;DR通过元优化的方式,引入一种能够灵活表征一系列进化策略的因果 Transformer 架构 ——Evolution Transformer,用于从数据中直接发现强大的优化原理。通过 Evolution Transformer,结合进化算法蒸馏技术进行模型权重训练,我们得到一个在特定上下文中表现良好且能够很好泛化到其他具有挑战性的神经进化任务的模型。此外,我们还分析了 Evolution Transformer 的属性,并提出了一种全自引用训练的技术,从随机初始化开始并引导其自身的学习进程。我们提供了一个开源实现,网址为 https://<URL>