Jun, 2019

Transformer 的计划采样

TL;DR该研究提出了一种双重解码策略使得计划采样技术可以应用于 Transformer 模型,以解决序列生成中出现的曝光偏置问题,该技术可大幅提高模型的性能,并表明其具有进一步探索的潜力。