越南语中基于方面的情感分析的跨度检测
本文提出了一种基于多个线性链 CRFs 的详细有效的结构化关注模型,通过聚合多个线性链 CRFs,该设计允许模型提取特定方面的意见跨度,然后利用提取的意见特征评估情感极性,实验证明该模型是有效的。
Oct, 2020
本文通过创建用于评估基于方面的情感分析的新基准语料库 ——UIT-ViSFD,介绍了构建越南社交听取系统的流程。通过采用双向 LSTM 架构与快速文本词向量的方案,该系统在方面任务和情感任务方面取得了 84.48%和 63.06%的 F1 分数,获得了比传统机器学习和深度学习系统更好的性能,并构建了基于该模型的 SA2SL 社交听取系统,这将激励未来的社交听取系统。
May, 2021
在越南这一领域中,滥用在各种形式上,包括身体、心理、言语、性、财务和文化上,对心理健康产生负面影响。然而,在应用自然语言处理(NLP)方面,关于这个领域的研究还非常有限。因此,我们的目标是通过构建一个越南人标注的数据集,来检测越南叙事文本中的滥用内容。我们从越南受欢迎的在线报纸 VnExpress 中获取了这些文本,读者经常分享包含滥用内容的故事。在数据集创建过程中,识别和分类这些文本中的滥用内容面临着重大挑战,但也激发了我们的研究兴趣。我们尝试了轻量级的基准模型,通过冻结 PhoBERT 和 XLM-RoBERTa,使用它们的隐藏状态在 BiLSTM 中评估数据集的复杂性。根据我们的实验结果,PhoBERT 在标记和未标记的滥用内容检测任务中表现优于其他模型。这些结果表明,它在未来有改进的潜力。
Dec, 2023
本论文介绍了我们在 SemEval 2016 任务 5 中使用深度学习的多语言基于方面的情感分析的方法。我们使用卷积神经网络(CNN)对方面抽取和基于方面的情感分析进行处理。我们将方面提取视为一个多标签分类问题,输出一个阈值参数化的方面概率。为了确定对方面的情感态度,我们使用局限系统(英语不受限制)对语句进行分析,其在所有语言和领域中均取得了竞争性的结果,对于方面类别检测(插槽 1)和情感极性(插槽 3)分别在 11 种语言域对中的 5 个和 7 个中排名第一或第二,从而证明深度学习为基于方面和多语言的情感分析方法的可行性。
Sep, 2016
本文探索了两种从文档级数据转移知识的方法,以提高方面级情感分类的性能。我们在 SemEval 2014、2015 和 2016 年的 4 个公共数据集上证明了我们方法的有效性,并显示注意力机制的 LSTM 从文档级知识中受益。
Jun, 2018
概述:该研究提出了 ViHOS 数据集,它是第一个包含 11k 条评论和 26k 个含有仇恨和攻击性言论的人工标注的数据集。通过使用各种最先进的模型进行实验,我们发现 XLM-R $_{Large}$ 在单个范围检测和所有范围检测方面取得了最佳的 F1 分数,而 PhoBERT $_{Large}$ 在多个范围检测方面获得了最高的分数。该研究的目的在于帮助解决社交网络平台上存在的恶意和攻击性言论的问题。
Jan, 2023
本研究使用机器学习和自然语言处理技术(NaiveBayes,Maximum Entropy,Long Short-Term Memory,Bi-Directional Long Short-Term Memory)对来自大学的越南学生反馈语料库进行情感分析,得出使用双向长短期记忆算法进行情感分类的结果最好,可帮助学校识别出问题并提出改进方法。
Nov, 2019
本文介绍了使用 BERT fine-tuning 方法处理越南评论数据集中情感分析任务的实验结果,并且发现相比于使用 GloVe 和 FastText,使用 BERT 模型略胜一筹。同时,本文研究提出的 BERT fine-tuning 方法也比原模型表现更好。
Nov, 2020
本文提出了一种新方法,通过解决上下文特定词义的挑战来提高情感分析的效果。它结合了双向长短期记忆网络(Bi-LSTM)和知识图谱的同义词数据的优势,利用动态注意力机制开发出一种知识驱动的状态向量。为了对特定方面的情感进行分类,该方法构建了一个集成位置数据的存储库,然后使用多层门控循环单元(GRU)分析此数据以确定与特定方面词相关的情感特征。对三个广泛可用的数据集的测试结果表明,该方法在情感分类方面表现出优秀的性能。
Dec, 2023
研究新架构用于情感分析的任务,结合了大规模的 MEGA-DT treebank 以及基于混合 TreeLSTM 分层注意模型的神经架构,通过情感相关的话语增强情感预测性能,实验结果显示,性能优于使用先前基于人类注释数据训练的良好建立的话语解析器的方法,同时演示了一个简单的组合方法如何进一步增强性能。
Nov, 2020