基于 Transformer 的鲁棒代码混合情感分类系统：SemEval-2020 任务 9 中的 Palomino-Ochoa

COLINGNov, 2020

基于 Transformer 的鲁棒代码混合情感分类系统：SemEval-2020 任务 9 中的 Palomino-Ochoa

Palomino-Ochoa at SemEval-2020 Task 9: Robust System based on Transformer for Code-Mixed Sentiment Classification

Daniel Palomino, Jose Ochoa-Luna

TL;DR本文介绍了一种混合英语 - 西班牙语情感分类任务的迁移学习系统，使用 BERT 语言模型，在 ULMFiT 迁移学习管道内进行嵌入，允许我们预测 code-mixed (英语 - 西班牙语) 推文的情感极性检测。

Abstract

We present a transfer learning system to perform a mixed Spanish-English sentiment classification task. Our proposal uses the state-of-the-art language model →

transfer learning bert sentiment classification code-mixed polarity detection

发现论文，激发创造

使用变形金刚和多任务学习识别混合代码社交媒体文本中的情感 - 在 SemEval-2020 任务 9 中的 UPB

本篇论文描述了研究团队为 SemEval-2020 Task 9 开发的两个系统，用于涵盖印地语 - 英语和西班牙语 - 英语这两种混合语言。通过介绍利用多种神经网络方法和预训练的单词嵌入的解决方案，我们提出的多语言 BERT 方法在印地语 - 英语任务中取得了有前途的表现，平均 F1 得分为 0.6850，对于西班牙语 - 英语任务，我们使用另一种基于 Transformer 的多语言模型 XLM-RoBERTa 获得了平均 F1 得分为 0.7064，排名团队第 17 位 (29 个参赛者中).

Sep, 2020

SemEval-2020 任务 9：代码混合推文的情感分析概述

本文介绍了 SemEval-2020 任务 9 关于混合代码推文情感分析（SentiMix 2020）的结果，释放和描述了标记有单词级别语言识别和句子级别情感标签的 Hinglish（印地语 - 英语）和 Spanglish（西班牙语 - 英语）语料库。最好的表现是在 Hinglish 和 Spanglish 分别获得了 75.0％ F1 得分和 80.6％ F1 得分。观察到在比赛者中 BERT-like 模型和集合方法是最常见和成功的方法。

Aug, 2020

MeisterMorxrc 参加 SemEval-2020 任务 9：细调 Bert 和多任务学习用于代码混合推文的情感分析

该研究介绍了如何使用自然语言处理技术对不同领域的文本进行情感分析，特别是针对语言混合推文的预处理以及 Bidirectional Encoder Representation from Transformers（BERT）的调优的方法，并在 SemEval-2020 的竞赛中取得了很好的成绩。

Dec, 2020

使用 XLM-T、Google Translate 和集成学习的多语言推文亲密度检测在 SemEval-2023 任务 9 中的应用

本文基于 XLM-T 提出了一种基于 transformer 的系统，用于预测多语言推特的亲密度，使用英语翻译数据可用于优化训练和推理，取得了 0.599 的总体 Pearson's r 值和排名第四的成绩。

Apr, 2023

UBC-DLNLP 参加 SemEval-2023 任务 12：迁移学习对非洲情感分析的影响

该研究通过使用六种语言模型并采用迁移学习和微调技术，开发了用于 14 种不同非洲语言情感分析的多语言模型，最终在开发和测试数据中取得了 F1 得分。结果表明跨多种语言的情感分析可以通过迁移学习和微调技术实现，该方法可以应用于其他语言和领域的情感分析任务。

Apr, 2023

UPB 在 IberLEF-2023 AuTexTification 中的使用：使用 Transformer 集成检测机器生成的文本

该研究论文描述了 UPB 团队在 IberLEF-2023 的 AuTexTification 共享任务中提交的解决方案，主要使用基于 Transformer 的深度学习模型以及多任务学习等训练技术，最佳模型在英语和西班牙语数据集上分别达到了 66.63% 和 67.10% 的宏 F1 分数。

Aug, 2023

利用多语言 Transformer 使用伪标签增强多语言和代码混合的复杂命名实体识别 —— 在 SemEval-2022 任务 11 中的 UM6P-CS 模型

使用多语言 Transformer XLM-RoBERTa 的上下文化表示来处理多语言和混合编码查询的复杂 NER 任务，通过 CRF 的标记分类层和拾取来捕获命名实体范围和使用自我培训机制从大型未标记数据集生成弱标注数据。在 Multilingual Complex Named Entity Recognition 的共享任务中，我们的提出的系统在多语言和混合编码 MultiCoNER 的追踪中分别排名第 6 和第 8。

Apr, 2022

使用预训练多语言嵌入和分词技术的混合语种文本情感分类

本论文提出一种自然语言处理算法，利用混合文本中的语码切换点，用基于大型预训练多语言模型的语义相似性和人工制作的积极和消极词汇集来确定语码切换文本的极性，以实现情感分析，其准确性和 F1 分数较基准模型提高了 11.2% 和 11.64%。

Oct, 2022

UCAS-IIE-NLP 在 SemEval-2023 任务 12 中的表现：增强低资源情感分析的多语言 BERT 泛化能力

本文描述了我们为 SemEval-2023 任务 12 而设计的系统：对非洲语言进行情感分析。为了缓解低资源环境下标记数据和语言资源的短缺问题，我们提出了一个通用的多语言系统 SACL-XLMR，用于对低资源语言进行情感分析。我们的系统在多语言和零样本情感分类子任务中表现出色，并在零样本分类子任务中获得了官方排名的第一名。

Jun, 2023

kk2018 参加 SemEval-2020 任务 9：针对混合编码的情感分类进行对抗性训练

本篇论文旨在探究作为一种语言现象的码代码搭配和混合情感分类在领域转移学习和多语言模型中的应用，通过测试 ERNIE 单一语言模型和对抗训练得到了强的基线和对 2020 SemEval 竞赛中印度 - 英语情感分类任务第一名的表现。

Sep, 2020