利用转化后的单语词向量的深度学习范式,进行多语言情感分析
本文主要研究了基于深度学习与多模态语料库的阿拉伯情感分析的数据集,通过使用最先进的 transformers 和特征提取工具来建立我们的阿拉伯多模态数据集,并使用 state-of-the-art 的 transformer-based model 验证我们的数据集,研究表明阿拉伯多模态情感分析非常有前途。
Jun, 2023
近年来,多模态自然语言处理引起了广泛关注,但我们需要更清晰地分析多语言环境下的多模态任务。本文通过一个简单的策划过程,将一份现有的文本 Twitter 情感数据集转化为多模态格式,从而填补了先前主要关注英语的情感分析研究的空白,并为研究界开辟了情感相关研究的新领域。此外,我们利用这个增强的数据集进行了基准实验,并报告了结果。值得注意的是,我们的评估结果显示,在单模态和多模态配置相比较时,使用一个经过情感调整的大型语言模型作为文本编码器表现出色。
Apr, 2024
本论文介绍了我们在 SemEval 2016 任务 5 中使用深度学习的多语言基于方面的情感分析的方法。我们使用卷积神经网络(CNN)对方面抽取和基于方面的情感分析进行处理。我们将方面提取视为一个多标签分类问题,输出一个阈值参数化的方面概率。为了确定对方面的情感态度,我们使用局限系统(英语不受限制)对语句进行分析,其在所有语言和领域中均取得了竞争性的结果,对于方面类别检测(插槽 1)和情感极性(插槽 3)分别在 11 种语言域对中的 5 个和 7 个中排名第一或第二,从而证明深度学习为基于方面和多语言的情感分析方法的可行性。
Sep, 2016
本研究介绍了两种新技术(多语言结构化同义词嵌入和跨语言深度神经情感传播),用于自动将情感注释从部分注释的 WordNet 传播到整个 WordNet 以及不同语言的 WordNet。通过对普林斯顿 WordNet 和波兰 WordNet 进行广泛评估,研究结果表明该方法在跨多种语言丰富 WordNet 的情感元数据方面优于现有传播方法,为大规模、多语言情感分析提供了坚实的基础,对学术研究和实际应用具有重要价值。
Dec, 2023
本文提出了一种新的多语言情感分类方法,使用了大量的弱监督数据训练多层卷积网络,通过在多种语言数据集上进行充分的评估,证明该方法的优异性能,达到了同类研究的最高水平。
Mar, 2017
该研究通过深度学习和嵌入可视化对多语言文本分类方法进行比较研究,特别关注 FastText 和 Sentence Transformer 模型,并探索了维度对聚类的影响。研究结果显示,FastText 在二维可视化中显示出更清晰的聚类效果,取得了显著的准确性、精确率、召回率和 F1 分数,优于 Sentence Transformer 模型。该研究强调了这些技术在多语言文本分类中的有效性,并强调了使用大型多语言语料库进行嵌入训练的重要性。它为未来的研究奠定了基础,并辅助开发语言检测和分类系统。此外,研究还对多层感知机、LSTM 和卷积模型进行了比较。
Dec, 2023
社交媒体的快速发展使得我们能够分析用户意见。尽管常用语言的情感分析已经取得了显著的进展,但由于资源限制,低资源语言像阿拉伯语等仍然很少有研究。本研究探讨了 SemEval-17 和阿拉伯语情感推文数据集上的推文文本的情感分析,并研究了四种预训练语言模型以及提出了两种集成语言模型。我们的发现包括单语言模型表现出更好的性能,集成模型优于基线,而多数投票集成模型胜过英语。
Mar, 2024
本文提出了一种基于多任务学习方法,利用源端的单语言语言资源来解决神经机器翻译中由于缺少平行文本造成模型质量差的问题,并采用语义分析、句法分析和命名实体识别等辅助任务以将语义和 / 或句法知识注入到翻译模型中,实现了在英法、英波斯和英越三种翻译任务上的有效性验证。
May, 2018
本论文提出一种自然语言处理算法,利用混合文本中的语码切换点,用基于大型预训练多语言模型的语义相似性和人工制作的积极和消极词汇集来确定语码切换文本的极性,以实现情感分析,其准确性和 F1 分数较基准模型提高了 11.2% 和 11.64%。
Oct, 2022