利用转化后的单语词向量的深度学习范式，进行多语言情感分析

Oct, 2017

利用转化后的单语词向量的深度学习范式，进行多语言情感分析

Deep Learning Paradigm with Transformed Monolingual Word Embeddings for Multilingual Sentiment Analysis

Yujie Lu, Tatsunori Mori

TL;DR本文研究利用深度学习方法，通过预训练单语词嵌入，将不同语种的词嵌入映射到共享嵌入空间中，从而进行多语情感分析。实验结果表明，我们的方法优于现有方法，其中 CNN 模型的分类准确率较目前最先进的基线高 2.1％。

Abstract

The surge of social media use brings huge demand of multilingual sentiment analysis (MSA) for unveiling cultural difference. So far, traditional methods resorted to machine translation---translating texts in other languages to English, and then adopt the methods once worked in English.

multilingual sentiment analysis social media deep learning monolingual word embeddings cnn model

发现论文，激发创造

无监督图注意力自编码器用于带属性网络的 K 均值丢失

利用最新的转换器和特征提取工具构建阿拉伯语多模态数据集，验证其在多模态学习中的效果，并展示阿拉伯语多模态研究的潜力。

Nov, 2023

面向阿拉伯语多模态情感分析数据集

本文主要研究了基于深度学习与多模态语料库的阿拉伯情感分析的数据集，通过使用最先进的 transformers 和特征提取工具来建立我们的阿拉伯多模态数据集，并使用 state-of-the-art 的 transformer-based model 验证我们的数据集，研究表明阿拉伯多模态情感分析非常有前途。

Jun, 2023

M2SA：用于推特情感分析的多模态、多语言模型

近年来，多模态自然语言处理引起了广泛关注，但我们需要更清晰地分析多语言环境下的多模态任务。本文通过一个简单的策划过程，将一份现有的文本 Twitter 情感数据集转化为多模态格式，从而填补了先前主要关注英语的情感分析研究的空白，并为研究界开辟了情感相关研究的新领域。此外，我们利用这个增强的数据集进行了基准实验，并报告了结果。值得注意的是，我们的评估结果显示，在单模态和多模态配置相比较时，使用一个经过情感调整的大型语言模型作为文本编码器表现出色。

Apr, 2024

SemEval-2016 任务 5 中的 INSIGHT-1：多语言基于方面的情感分析中的深度学习

本论文介绍了我们在 SemEval 2016 任务 5 中使用深度学习的多语言基于方面的情感分析的方法。我们使用卷积神经网络（CNN）对方面抽取和基于方面的情感分析进行处理。我们将方面提取视为一个多标签分类问题，输出一个阈值参数化的方面概率。为了确定对方面的情感态度，我们使用局限系统（英语不受限制）对语句进行分析，其在所有语言和领域中均取得了竞争性的结果，对于方面类别检测（插槽 1）和情感极性（插槽 3）分别在 11 种语言域对中的 5 个和 7 个中排名第一或第二，从而证明深度学习为基于方面和多语言的情感分析方法的可行性。

Sep, 2016

跨语言深情感：多语言词网中情感传播的新方法

本研究介绍了两种新技术（多语言结构化同义词嵌入和跨语言深度神经情感传播），用于自动将情感注释从部分注释的 WordNet 传播到整个 WordNet 以及不同语言的 WordNet。通过对普林斯顿 WordNet 和波兰 WordNet 进行广泛评估，研究结果表明该方法在跨多种语言丰富 WordNet 的情感元数据方面优于现有传播方法，为大规模、多语言情感分析提供了坚实的基础，对学术研究和实际应用具有重要价值。

Dec, 2023

利用大量弱监督数据进行多语言情感分类

本文提出了一种新的多语言情感分类方法，使用了大量的弱监督数据训练多层卷积网络，通过在多种语言数据集上进行充分的评估，证明该方法的优异性能，达到了同类研究的最高水平。

Mar, 2017

跨语言文本分类与识别的深度学习和嵌入可视化的比较分析

该研究通过深度学习和嵌入可视化对多语言文本分类方法进行比较研究，特别关注 FastText 和 Sentence Transformer 模型，并探索了维度对聚类的影响。研究结果显示，FastText 在二维可视化中显示出更清晰的聚类效果，取得了显著的准确性、精确率、召回率和 F1 分数，优于 Sentence Transformer 模型。该研究强调了这些技术在多语言文本分类中的有效性，并强调了使用大型多语言语料库进行嵌入训练的重要性。它为未来的研究奠定了基础，并辅助开发语言检测和分类系统。此外，研究还对多层感知机、LSTM 和卷积模型进行了比较。

Dec, 2023

多语言情感分析的集成语言模型

社交媒体的快速发展使得我们能够分析用户意见。尽管常用语言的情感分析已经取得了显著的进展，但由于资源限制，低资源语言像阿拉伯语等仍然很少有研究。本研究探讨了 SemEval-17 和阿拉伯语情感推文数据集上的推文文本的情感分析，并研究了四种预训练语言模型以及提出了两种集成语言模型。我们的发现包括单语言模型表现出更好的性能，集成模型优于基线，而多数投票集成模型胜过英语。

Mar, 2024

基于深度多任务学习的双语稀缺情境神经机器翻译

本文提出了一种基于多任务学习方法，利用源端的单语言语言资源来解决神经机器翻译中由于缺少平行文本造成模型质量差的问题，并采用语义分析、句法分析和命名实体识别等辅助任务以将语义和 / 或句法知识注入到翻译模型中，实现了在英法、英波斯和英越三种翻译任务上的有效性验证。

May, 2018

使用预训练多语言嵌入和分词技术的混合语种文本情感分类

本论文提出一种自然语言处理算法，利用混合文本中的语码切换点，用基于大型预训练多语言模型的语义相似性和人工制作的积极和消极词汇集来确定语码切换文本的极性，以实现情感分析，其准确性和 F1 分数较基准模型提高了 11.2% 和 11.64%。

Oct, 2022