ACLJun, 2019
使用可信的负面样本评估和改进聊天机器人文本分类的数据质量
Evaluation and Improvement of Chatbot Text Classification Data Quality Using Plausible Negative Examples
Kit Kuksenok, Andriy Martyniv
TL;DR我们描述并验证了一种基于交叉验证的度量标准,用于评估小型、不平衡的自然语言数据集在聊天机器人设计中的应用,该度量标准利用负样例在文本分类的评估中,并满足可行性、可比较和模型不可知等三个要求。