MultiBooked: 基于方面级情感分类的巴斯克语和加泰罗尼亚语酒店评论语料库
该研究提供了一个由 79 个数据集组成的开放性跨语言语料库,可用于培训情感模型,同时展现了基于不同基础模型、训练目标、数据集集合和微调策略所进行的数百次实验的多方面情感分类基准。
Jun, 2023
本论文介绍了我们在 SemEval 2016 任务 5 中使用深度学习的多语言基于方面的情感分析的方法。我们使用卷积神经网络(CNN)对方面抽取和基于方面的情感分析进行处理。我们将方面提取视为一个多标签分类问题,输出一个阈值参数化的方面概率。为了确定对方面的情感态度,我们使用局限系统(英语不受限制)对语句进行分析,其在所有语言和领域中均取得了竞争性的结果,对于方面类别检测(插槽 1)和情感极性(插槽 3)分别在 11 种语言域对中的 5 个和 7 个中排名第一或第二,从而证明深度学习为基于方面和多语言的情感分析方法的可行性。
Sep, 2016
本研究旨在解决对于孟加拉语资源与跨领域适应性缺乏研究的限制,因此提出一个大规模的孟加拉语电子书评论数据集, 使用各种机器学习模型分析数据,发现预训练模型比手工特征模型具有更高的性能,同时进行错误分析以提供关于在孟加拉语等欠资源语言中常见的分类错误的见解。
May, 2023
本文提出了一种新的多语言情感分类方法,使用了大量的弱监督数据训练多层卷积网络,通过在多种语言数据集上进行充分的评估,证明该方法的优异性能,达到了同类研究的最高水平。
Mar, 2017
本文提出了一种极弱监督的多标签方面类别情感分析框架,并提出了一种自动词语选择技术来选择这些种子类别和情感词,利用无监督语言模型后训练来提高性能,在四个基准数据集上的实验证明了该方法显著优于其他弱监督基线。
Nov, 2022
本研究使用零样本和小样本学习进行跨语言情感分析。采用三种语言的 BERT-based 模型进行语种间的情感分类,提出了一种简单多任务模型。通过单任务和多任务实验的零样本和小样本场景对克罗地亚言和斯洛文尼亚情感分析进行评估。
Dec, 2022
本论文介绍了一种新的多语言多方面仇恨言论分析数据集,并使用它测试当前最先进的多语言多任务学习方法,通过在各种分类环境下评估我们的数据集,我们讨论了如何利用我们的注释以改进仇恨言论的检测和分类。
Aug, 2019
本文旨在使用词级情感注释生成 Telugu 语的系统注释语料库,旨在验证和研究利用机器学习算法,词级情感注释在自动情感识别任务中的可能性以及通过注释目标语料库中提取的二元组提高准确性,此外,我们通过语言专家对 11,000 个形容词、253 个副词、8483 个动词进行情感注释,讨论了极性注释的方法以及我们所开发的资源的基准质量。
Jul, 2018
本文通过收集来自 MercadoLibre 网站七个国家的商品评论,建立了一个大型且平衡的数据集,研究了一个基于该数据集训练的情感分类系统在泛化到不同西班牙语领域的能力,结果表明该分类系统的泛化能力有一定可行性,但需要使用预训练和微调技术进行改进。
Mar, 2023