Apr, 2020

DIET: 对话系统的轻量级语言理解

TL;DRDIET架构研究了不同预训练表示对意向和实体预测的有效性,并在多领域NLU数据集上取得了最新的技术水平,没有明显的使用大规模预训练模型的好处,实际上DIET即使在没有预先训练嵌入的情况下,也改进了现有技术水平,效果最佳的模型优于Fine-tuning BERT并且训练速度快六倍。