EMNLPJun, 2024

EMO-KNOW:情感和情感原因的大规模数据集

TL;DR近年来,情绪原因分析引起了研究人员的关注。为了填补现有数据集在规模和情绪类别数量上的限制,并提供更具抽象性和可推广性的根本原因,我们引入了一个由 1500 万个清理后的推文构成的大规模情绪原因数据集。我们描述了我们的筛选过程,其中包括全面的数据收集、清理、标记和验证流程,以确保数据集的可靠性和丰富性。我们提取情绪标签,并提供导致情绪的事件的抽象化摘要。最终的数据集包括超过 70 万个推文和对应的情绪 - 原因对,涵盖了 48 个情绪类别,并由人工评估员进行了验证。我们数据集的新颖之处在于它涵盖了广泛的情绪类别,并提供了抽象的情绪原因,从而促进了情绪 - 原因知识图谱的细致推理。我们的数据集将使得能够考虑不同人对同一事件的多样化情绪反应的情绪感知系统的设计成为可能。