ACLJun, 2019

使用可信的负面样本评估和改进聊天机器人文本分类的数据质量

TL;DR我们描述并验证了一种基于交叉验证的度量标准,用于评估小型、不平衡的自然语言数据集在聊天机器人设计中的应用,该度量标准利用负样例在文本分类的评估中,并满足可行性、可比较和模型不可知等三个要求。