Jun, 2019

并行计划采样

TL;DR本文介绍了一种简单的方法,通过时间并行化可以减轻固定顺序随机替换预测值的 “计划采样”,并在图像生成、文本摘要、对话生成和翻译等任务中实现与传统教师强制训练相当或更好的性能。