ICMLJan, 2019

进化 Transformer

TL;DR本研究旨在使用神经架构搜索技术应用于 Transformer 结构中,通过进化架构搜索技术,探索发现了性能更好的替代模型 Evolved Transformer,该模型不仅在 WMT 2014 英德翻译任务上取得了新的性能最优结果,且在模型容量更小的情况下性能优于原始模型。