Feb, 2022

一种增强意图分类的新数据增强方法及其在口语对话数据集上的应用

TL;DR本文介绍了一种用于自动数据选择和标记的 NNSI 算法,该算法通过集成分类器从语义上相似的文本样本组的输出,自动选择高度模糊的样本并以高精度标记它们。我们在两个大型语音会话系统上演示了 NNSI 的使用,并评估了结果,证明了该方法能够选择并标记高质量的有用样本,加入训练数据集可使分类器的准确性显著提高并将误差率降低高达 10%。