Mar, 2024

MaCmS:用于情感分析的马加希混码数据集

TL;DR本文介绍了用于情感分析任务的新情感数据集 MaCMS,包含马加希语 - 印地语 - 英语(MHE)混合编码语言,这是第一个用于情感分析任务的马加希语 - 印地语 - 英语混合编码数据集。此外,我们还对数据集进行了语言学分析,以了解代码混合的结构,并进行了统计研究以了解具有不同极性的说话者的语言偏好。通过这些分析,我们还训练了基准模型来评估数据集的质量。