Apr, 2020

DIET: 对话系统的轻量级语言理解

TL;DRDIET 架构研究了不同预训练表示对意向和实体预测的有效性,并在多领域 NLU 数据集上取得了最新的技术水平,没有明显的使用大规模预训练模型的好处,实际上 DIET 即使在没有预先训练嵌入的情况下,也改进了现有技术水平,效果最佳的模型优于 Fine-tuning BERT 并且训练速度快六倍。