Apr, 2019

通过知识蒸馏提高用于自然语言理解的多任务深度神经网络

TL;DR本文使用知识蒸馏方法对多任务深度神经网络进行优化,提供了解决集成大型神经网络问题的方法,并在 GLUE 基准测试中取得了显著的成果。