ACLApr, 2019

对话系统中的异常值检测,提高数据质量和多样性

TL;DR使用神经句向量和基于距离的异常检测技术,本文介绍了一种检测短文本语料中错误和独特样本的技术,并提出了一种新的数据采集流程,可以同时去除错误数据和自动挖掘独特数据,实验结果表明,该技术可以有效地发现错误并产生更鲁棒的意图分类和槽位填充模型。