SemEval-2020 Task 9 中的 HCMS：一种用于代码混合文本情感分析的神经网络方法

ACLJul, 2020

SemEval-2020 Task 9 中的 HCMS：一种用于代码混合文本情感分析的神经网络方法

HCMS at SemEval-2020 Task 9: A Neural Approach to Sentiment Analysis for Code-Mixed Texts

Aditya Srivastava, V. Harsha Vardhan

TL;DR本文描述了我们在 Sentimix 印地语 - 英语任务中提交的内容，涉及对代码混合文本进行情感分类，并表现出 F1 得分为 67.1％，证明简单的卷积和注意力可能会产生合理的结果。

Abstract

Problems involving code-mixed language are often plagued by a lack of resources and an absence of materials to perform sophisticated transfer learning with. In this paper we describe our submission to the Sentimix Hindi-English task involving →

code-mixed language sentiment classification convolution attention transfer learning

发现论文，激发创造

使用变形金刚和多任务学习识别混合代码社交媒体文本中的情感 - 在 SemEval-2020 任务 9 中的 UPB

本篇论文描述了研究团队为 SemEval-2020 Task 9 开发的两个系统，用于涵盖印地语 - 英语和西班牙语 - 英语这两种混合语言。通过介绍利用多种神经网络方法和预训练的单词嵌入的解决方案，我们提出的多语言 BERT 方法在印地语 - 英语任务中取得了有前途的表现，平均 F1 得分为 0.6850，对于西班牙语 - 英语任务，我们使用另一种基于 Transformer 的多语言模型 XLM-RoBERTa 获得了平均 F1 得分为 0.7064，排名团队第 17 位 (29 个参赛者中).

Sep, 2020

SemEval-2020 任务 9：代码混合推文的情感分析概述

本文介绍了 SemEval-2020 任务 9 关于混合代码推文情感分析（SentiMix 2020）的结果，释放和描述了标记有单词级别语言识别和句子级别情感标签的 Hinglish（印地语 - 英语）和 Spanglish（西班牙语 - 英语）语料库。最好的表现是在 Hinglish 和 Spanglish 分别获得了 75.0％ F1 得分和 80.6％ F1 得分。观察到在比赛者中 BERT-like 模型和集合方法是最常见和成功的方法。

Aug, 2020

一种用于印地语 - 英语混合编码数据情感分析的集成模型

本研究提出了基于字符三元组 LSTM 模型和基于词元素的多项式朴素贝叶斯 (MNB) 模型的集成模型，用于识别印地语 - 英语 (Hi-En) 混合数据的情感极性，实验结果表明，相较于几个基准和其他基于深度学习的提出的方法，我们的方法在真实用户混合数据上取得了最先进的结果。

Jun, 2018

面向印地语 - 英语代码混合文本情感分析的子词级组合研究

本文介绍了一种采用亚词级别表示 (Subword-LSTM) 架构进行 Hindi-English 混合代码情感分析的方法，该方法能更好地学习重要的语素的情感信息，同时在包含拼写错误的高噪声文本中表现良好，比传统的方法在数据集上的准确率提高了 4-5％，并且比可用的系统在 Hi-En 混合文本的情绪分析方面性能提高了 18％。

Nov, 2016

NLP-CIC 在 SemEval-2020 任务 9 中使用简单深度学习分类器分析混合语言情感

本文通过使用卷积神经网络模型来预测西班牙语和英语混合推文的情感，取得了 F1-score 为 0.71 的成绩，并分析了模型的能力和代码切换语境下分类情感的重要困难。

Sep, 2020

混合马拉雅拉姆语 - 英语情感分析数据集

本文提供了一个新的黄金标准情感分析语料库，用于马拉雅拉姆语 - 英语混合文本的情感分析基准，并使用有监督方法进行了分析。

May, 2020

利用丰富资源语言进行混合语言情感分析

本文提出了一种名为 SACMT 的新方法，使用对比学习将混合代码和标准语言的句子映射到共同的情感空间，通过基本的聚类预处理方法来捕捉混合语音文字的变化，并且在情感分析中优于现有方法 7.6% 的准确度和 10.1% 的 F 分数。

Apr, 2018

Memotion 3: 代码混合 Hinglish 模因的情感分析与情绪分析概述

分析互联网上的迷因已成为一项重要的任务，因为这种多模态内容在塑造在线言论方面具有重要影响力。本文介绍了 Memotion 3 共享任务的概述，作为 AAAI-23 会议中 DeFactify 2 研讨会的一部分。该任务发布了一份基于情感（任务 A）、情绪（任务 B）和情绪强度（任务 C）方面的标注数据集，并分别对每个任务的参与者进行排名。共有超过 50 个团队注册参与该共享任务，其中 5 个团队向 Memotion 3 数据集的测试集提交了最终结果。参与者中最流行的模型包括 CLIP、BERT 修改版、ViT 等，同时还采用了学生 - 教师模型、融合和集成等方法。任务 A 的最佳 F1 分数为 34.41，任务 B 为 79.77，任务 C 为 59.82。

Sep, 2023

kk2018 参加 SemEval-2020 任务 9：针对混合编码的情感分类进行对抗性训练

本篇论文旨在探究作为一种语言现象的码代码搭配和混合情感分类在领域转移学习和多语言模型中的应用，通过测试 ERNIE 单一语言模型和对抗训练得到了强的基线和对 2020 SemEval 竞赛中印度 - 英语情感分类任务第一名的表现。

Sep, 2020

JU_NLP 在 HinglishEval 的表现：对低资源代码混合的 Hinglish 文本的质量评估

本文介绍了一种基于 Bi-LSTM 的神经网络模型，用于预测合成 Hinglish 数据集的平均评分得分和不一致性得分，并在 INLG 2022 代表的 Generation Challenge 中达到了 F1 得分为 0.11 和平均平方误差为 6.0 的平均评分得分预测任务的成果，以及 F1 得分为 0.18 和平均平方误差为 5.0 的不一致性得分预测任务的成果。

Jun, 2022