使用词向量嵌入的深度学习模型进行蒙古公民反馈分析
本研究使用机器学习和自然语言处理技术(NaiveBayes,Maximum Entropy,Long Short-Term Memory,Bi-Directional Long Short-Term Memory)对来自大学的越南学生反馈语料库进行情感分析,得出使用双向长短期记忆算法进行情感分类的结果最好,可帮助学校识别出问题并提出改进方法。
Nov, 2019
本文介绍了如何在中文情感分类中使用单词嵌入作为特征,并建立了一个包含一百万个评论的中文意见语料库。通过使用不同的机器学习方法,包括支持向量机 (SVM),逻辑回归 (Logistic Regression),卷积神经网络 (CNN) 和集成方法,这些方法相对于使用朴素贝叶斯 (NB) 和最大熵 (ME) 的 n-gram 模型获得了更好的性能。最后,提出了一种组合机器学习方法,并在语料库上进行测试,最终的 F1 分数为 0.920。
Nov, 2015
本文研究利用深度学习方法,通过预训练单语词嵌入,将不同语种的词嵌入映射到共享嵌入空间中,从而进行多语情感分析。实验结果表明,我们的方法优于现有方法,其中 CNN 模型的分类准确率较目前最先进的基线高 2.1%。
Oct, 2017
该研究通过深度学习和嵌入可视化对多语言文本分类方法进行比较研究,特别关注 FastText 和 Sentence Transformer 模型,并探索了维度对聚类的影响。研究结果显示,FastText 在二维可视化中显示出更清晰的聚类效果,取得了显著的准确性、精确率、召回率和 F1 分数,优于 Sentence Transformer 模型。该研究强调了这些技术在多语言文本分类中的有效性,并强调了使用大型多语言语料库进行嵌入训练的重要性。它为未来的研究奠定了基础,并辅助开发语言检测和分类系统。此外,研究还对多层感知机、LSTM 和卷积模型进行了比较。
Dec, 2023
本研究旨在探讨在语言不匹配的情况下,预先在英语语料库上训练的模型是否适用于使用匈牙利语的目标低资源语言的嫌疑人语音识别,并发现在对嫌疑人的语音样本越长,预训练模型的性能越好。
Sep, 2022
该研究探讨神经机器翻译模型所学到的嵌入,在需要同时考虑概念相似性和词汇 - 句法角色知识的任务中,它们的性能优于单语言模型所学到的嵌入。研究结果还表明,词汇扩展算法对嵌入质量的影响很小。
Dec, 2014
本文分享了实验的结果,探讨在自然语言处理领域中,以仿射变换为基础的学习模型(Transformer-based Language Models,简称 TLM)作为最佳模型,实现对巴西葡萄牙语用户评论的情感分析,该研究对 Bag-of-Words 到 Transformer-based NLP 模型进行了评估。
Dec, 2022
我们引入和实现了一个基于混合深度学习的模型,用于对 Digikala Online 零售网站的客户评论数据进行情感分析,采用了多种深度学习网络和正则化技术作为分类器。最终,我们的混合方法在三个情感类别(积极,消极,中立)上实现了出色的性能,F1 分数达到了 78.3。
Mar, 2024