Apr, 2019

ELMo嵌入的替代加权方案

TL;DR本文讨论如何在使用ELMo嵌入的情况下,通过加权平均其产生的三个向量的前两个向量以提高下游NLP任务的性能,并实现语言模型的简化,从而获得更快的训练速度。