本文述及基于最近三年的神经网络技术,通过直接从语音信号中提取语义,取代传统的分类式自然语言处理方式,以 spoken language understanding 话题研究为主,在利用未标记的数据进行自我监督训练方面取得了新的突破。同时介绍了针对法语 MEDIA 数据集的最新进展,并提出了得到明显改进的成果,概念误差率(CER)从现有最优系统的 13.6% 降至 11.2%。
该论文讨论了使用深度学习技术进行自然语言理解的联合任务,包括意图检测和槽填充,介绍了 Spoken Language Understanding/Natural Language Understanding(SLU/NLU)技术和用于解决该问题的最新自然语言处理和深度学习技术,以及如何提高性能的一些方法。