Feb, 2019

星形转换器

TL;DR本文介绍了Star-Transformer,一种轻量级的NLP模型,通过精细的稀疏化将全连接注意力连接结构替换为星形拓扑结构,将复杂性从二次降为线性,同时保持了捕获局部组合和长距离依赖性的能力,并在四个任务的22个数据集上取得了显著的性能提升。