SemEval-2020 Task 9 中的 HCMS:一种用于代码混合文本情感分析的神经网络方法
本篇论文描述了研究团队为 SemEval-2020 Task 9 开发的两个系统,用于涵盖印地语 - 英语和西班牙语 - 英语这两种混合语言。通过介绍利用多种神经网络方法和预训练的单词嵌入的解决方案,我们提出的多语言 BERT 方法在印地语 - 英语任务中取得了有前途的表现,平均 F1 得分为 0.6850,对于西班牙语 - 英语任务,我们使用另一种基于 Transformer 的多语言模型 XLM-RoBERTa 获得了平均 F1 得分为 0.7064,排名团队第 17 位 (29 个参赛者中).
Sep, 2020
本文介绍了 SemEval-2020 任务 9 关于混合代码推文情感分析(SentiMix 2020)的结果,释放和描述了标记有单词级别语言识别和句子级别情感标签的 Hinglish(印地语 - 英语)和 Spanglish(西班牙语 - 英语)语料库。最好的表现是在 Hinglish 和 Spanglish 分别获得了 75.0% F1 得分和 80.6% F1 得分。观察到在比赛者中 BERT-like 模型和集合方法是最常见和成功的方法。
Aug, 2020
本研究提出了基于字符三元组 LSTM 模型和基于词元素的多项式朴素贝叶斯 (MNB) 模型的集成模型,用于识别印地语 - 英语 (Hi-En) 混合数据的情感极性,实验结果表明,相较于几个基准和其他基于深度学习的提出的方法,我们的方法在真实用户混合数据上取得了最先进的结果。
Jun, 2018
本文介绍了一种采用亚词级别表示 (Subword-LSTM) 架构进行 Hindi-English 混合代码情感分析的方法,该方法能更好地学习重要的语素的情感信息,同时在包含拼写错误的高噪声文本中表现良好,比传统的方法在数据集上的准确率提高了 4-5%,并且比可用的系统在 Hi-En 混合文本的情绪分析方面性能提高了 18%。
Nov, 2016
本文通过使用卷积神经网络模型来预测西班牙语和英语混合推文的情感,取得了 F1-score 为 0.71 的成绩,并分析了模型的能力和代码切换语境下分类情感的重要困难。
Sep, 2020
本文提出了一种名为 SACMT 的新方法,使用对比学习将混合代码和标准语言的句子映射到共同的情感空间,通过基本的聚类预处理方法来捕捉混合语音文字的变化,并且在情感分析中优于现有方法 7.6% 的准确度和 10.1% 的 F 分数。
Apr, 2018
分析互联网上的迷因已成为一项重要的任务,因为这种多模态内容在塑造在线言论方面具有重要影响力。本文介绍了 Memotion 3 共享任务的概述,作为 AAAI-23 会议中 DeFactify 2 研讨会的一部分。该任务发布了一份基于情感(任务 A)、情绪(任务 B)和情绪强度(任务 C)方面的标注数据集,并分别对每个任务的参与者进行排名。共有超过 50 个团队注册参与该共享任务,其中 5 个团队向 Memotion 3 数据集的测试集提交了最终结果。参与者中最流行的模型包括 CLIP、BERT 修改版、ViT 等,同时还采用了学生 - 教师模型、融合和集成等方法。任务 A 的最佳 F1 分数为 34.41,任务 B 为 79.77,任务 C 为 59.82。
Sep, 2023
本篇论文旨在探究作为一种语言现象的码代码搭配和混合情感分类在领域转移学习和多语言模型中的应用,通过测试 ERNIE 单一语言模型和对抗训练得到了强的基线和对 2020 SemEval 竞赛中印度 - 英语情感分类任务第一名的表现。
Sep, 2020
本文介绍了一种基于 Bi-LSTM 的神经网络模型,用于预测合成 Hinglish 数据集的平均评分得分和不一致性得分,并在 INLG 2022 代表的 Generation Challenge 中达到了 F1 得分为 0.11 和平均平方误差为 6.0 的平均评分得分预测任务的成果,以及 F1 得分为 0.18 和平均平方误差为 5.0 的不一致性得分预测任务的成果。
Jun, 2022