使用词向量嵌入的深度学习模型进行蒙古公民反馈分析

Feb, 2023

使用词向量嵌入的深度学习模型进行蒙古公民反馈分析

Deep learning model for Mongolian Citizens Feedback Analysis using Word Vector Embeddings

Zolzaya Dashdorj, Tsetsentsengel Munkhbayar, Stanislav Grigorev

TL;DR本研究采用两种不同的词嵌入方法来对使用西里尔文的蒙古语进行反馈分类，结果表明使用自己的数据集的词嵌入模型可获得最高 80.1% 和 82.7％的分类准确度。

Abstract

A large amount of feedback was collected over the years. Many feedback analysis models have been developed focusing on the English language. Recognizing the concept of →

feedback mongolian language word embeddings deep learning classification

发现论文，激发创造

深度学习与传统分类器在越南学生反馈语料库上的对比

本研究使用机器学习和自然语言处理技术（NaiveBayes，Maximum Entropy，Long Short-Term Memory，Bi-Directional Long Short-Term Memory）对来自大学的越南学生反馈语料库进行情感分析，得出使用双向长短期记忆算法进行情感分类的结果最好，可帮助学校识别出问题并提出改进方法。

Nov, 2019

基于词向量的中文评论情感分类实证研究

本文介绍了如何在中文情感分类中使用单词嵌入作为特征，并建立了一个包含一百万个评论的中文意见语料库。通过使用不同的机器学习方法，包括支持向量机 (SVM)，逻辑回归 (Logistic Regression)，卷积神经网络 (CNN) 和集成方法，这些方法相对于使用朴素贝叶斯 (NB) 和最大熵 (ME) 的 n-gram 模型获得了更好的性能。最后，提出了一种组合机器学习方法，并在语料库上进行测试，最终的 F1 分数为 0.920。

Nov, 2015

利用转化后的单语词向量的深度学习范式，进行多语言情感分析

本文研究利用深度学习方法，通过预训练单语词嵌入，将不同语种的词嵌入映射到共享嵌入空间中，从而进行多语情感分析。实验结果表明，我们的方法优于现有方法，其中 CNN 模型的分类准确率较目前最先进的基线高 2.1％。

Oct, 2017

跨语言文本分类与识别的深度学习和嵌入可视化的比较分析

该研究通过深度学习和嵌入可视化对多语言文本分类方法进行比较研究，特别关注 FastText 和 Sentence Transformer 模型，并探索了维度对聚类的影响。研究结果显示，FastText 在二维可视化中显示出更清晰的聚类效果，取得了显著的准确性、精确率、召回率和 F1 分数，优于 Sentence Transformer 模型。该研究强调了这些技术在多语言文本分类中的有效性，并强调了使用大型多语言语料库进行嵌入训练的重要性。它为未来的研究奠定了基础，并辅助开发语言检测和分类系统。此外，研究还对多层感知机、LSTM 和卷积模型进行了比较。

Dec, 2023

使用深度学习嵌入表示法进行自动司法语音比对时语言不匹配的影响

本研究旨在探讨在语言不匹配的情况下，预先在英语语料库上训练的模型是否适用于使用匈牙利语的目标低资源语言的嫌疑人语音识别，并发现在对嫌疑人的语音样本越长，预训练模型的性能越好。

Sep, 2022

评估孟加拉语词汇类比

该论文提供了用于评估孟加拉语词嵌入质量的高质量数据集，该数据集对于基准测试和指导未来研究至关重要。

Apr, 2023

不是所有神经嵌入都是平等的

研究神经机器翻译模型和单语模型在表征词汇相似性和语法角色方面的性能，结果表明，神经翻译模型在捕捉概念的本体论状态方面比单语模型更胜一筹。

Oct, 2014

利用神经机器翻译嵌入词汇相似度

该研究探讨神经机器翻译模型所学到的嵌入，在需要同时考虑概念相似性和词汇 - 句法角色知识的任务中，它们的性能优于单语言模型所学到的嵌入。研究结果还表明，词汇扩展算法对嵌入质量的影响很小。

Dec, 2014

从词袋到 transformers: 面向巴西葡萄牙语用户评论的文本分类嵌入生成

本文分享了实验的结果，探讨在自然语言处理领域中，以仿射变换为基础的学习模型（Transformer-based Language Models，简称 TLM）作为最佳模型，实现对巴西葡萄牙语用户评论的情感分析，该研究对 Bag-of-Words 到 Transformer-based NLP 模型进行了评估。

Dec, 2022

基于深度学习的波斯语情感分析

我们引入和实现了一个基于混合深度学习的模型，用于对 Digikala Online 零售网站的客户评论数据进行情感分析，采用了多种深度学习网络和正则化技术作为分类器。最终，我们的混合方法在三个情感类别（积极，消极，中立）上实现了出色的性能，F1 分数达到了 78.3。

Mar, 2024