ACLJun, 2021

向量是否比专家更擅长阅读思维?比较儿童心理阅读能力自动评分中的数据增强策略

TL;DR本文对于儿童理解他人思想、感受和欲望的能力自动评分任务,实现和比较了 7 种不同的数据增强策略;除了对每种策略进行性能评估和对自动评分系统性能进行多次实验,还招募行业内专家重新注释增强样本以确定每个策略保留原始分数的程度。此外还创建了 UK-MIND-20 数据集并在 MIND-CA 数据集中获得了最新的最高性能,结果表明,训练样本的数量和增强策略的质量都影响系统的性能。