使用 GloVe 和神经网络模型进行多标签文本分类

Oct, 2023

使用 GloVe 和神经网络模型进行多标签文本分类

Multi-label Text Classification using GloVe and Neural Network Models

Hongren Wang

TL;DR多标签文本分类面临诸多挑战，本文提出了一种基于 GloVe 模型和 CNN-BiLSTM 网络的词袋模型方法，该方法在测试集上达到了 87.26% 的准确率和 0.8737 的 F1 分数，展现出了良好的结果。

Abstract

This study addresses the challenges of multi-label text classification. The difficulties arise from imbalanced data sets, varied text lengths, and numerous subjective feature labels. Existing solutions include tr

multi-label text classification imbalanced data sets deep neural networks bag-of-words model approach glove model

发现论文，激发创造

卷积神经网络用于句子分类

使用预训练字向量对卷积神经网络进行训练，支持 fine-tuning 并结合静态和动态字向量，以提高句子级分类准确率并在多项基准测试中超越现有技术。

Aug, 2014

单标签和多标签文本分类：词袋、序列、图、层次结构，我们真正取得了多少进展？

通过综合文献和自行实验，我们发现在单标签和多标签分类任务中，与精调的语言模型和 MLP 等标准机器学习方法相比，基于图的方法效果不如人意，甚至有时比基于词袋的 MLP 方法表现还要差，这进一步挑战了过去几年中新基于图方法的开发和它们在这一领域中的实际价值，并证实了预先训练的语言模型依然是文本分类中最先进的方法。因此，未来的文本分类研究需要仔细测试标准的机器学习算法如 MLP，以更好地评估其真正的科学进展。

Apr, 2022

用于危机响应的深度学习和词嵌入的推文分类

本文旨在研究使用不同神经网络和通用与领域特定词嵌入的应用能力，以提高推文分类模型的性能，结果表明 Bi-LSTM 模型使用通用词嵌入（如 GloVe）效果最佳，最高可达 62.04％的 F1 分数。

Mar, 2019

用于商业评论情感分类的卷积神经网络

本文使用卷积神经网络并采用单词嵌入技术，通过对 Yelp 2017 挑战数据集业务评论进行多次实验处理，取得了与传统方法相当的分类效果。

Oct, 2017

通过预测 N 元语法组合来学习文档嵌入，用于长篇电影评论的情感分类

通过改进 Paragraph Vector 的架构，使其可以学习预测单词和 n-gram 特征的文档向量，捕捉了文档中的语义和单词顺序，从而在 IMDB 电影评论数据集上实现比其他模型更好的情感分类结果，同时保持了向量的表达能力。

Dec, 2015

一种基于多模型的深度学习框架，用于处理不平衡和非常小的数据集进行短文本多分类

本文提出了一种基于多模态的深度学习框架，用于短文本多类别分类，针对于极小数据集，使用了 DISTILBERT 来获取上下文敏感的动态词向量，并取得了在精度、召回率、准确率和 F1 分数上与现有最优方法相同的性能，同时模型体积更小，可以在移动设备上更快、更轻地部署。

Jun, 2022

大规模多标签文本分类 - 重新审视神经网络

本文研究了神经网络在多标签分类中的应用，并提出了一种使用深度学习算法的简单神经网络模型取代 BP-MLL 模型进行文本分类，证明了这些模型在六个不同属性的数据集上具有较好的性能表现。

Dec, 2013

基于多种神经网络模型的越南社交媒体数据集的简单高效集成分类器

使用深度学习模型和集成模型对社交媒体上的越南文本进行分类，实现了比之前研究更好的性能。

Sep, 2020

ML-Net：基于深度神经网络的生物医学文本多标签分类

ML-Net 是一个新型的深度学习框架，用于多标签分类生物医学文本，它通过组合标签预测网络和自动标签计数预测机制来在输出标签时利用每个标签的预测置信度和目标文档中的上下文信息，无需人工特征工程，具有高效、可扩展等特点。

Nov, 2018

AI 深度学习算法在多模态情感分析中的实施

通过将两通道卷积神经网络与环状网络相结合，建立了一种多模态情感识别方法，该方法可以有效提取情感信息并提高学习效率。实验表明，基于特征融合的情感分析方法能够有效提高情感数据集的识别准确性，并减少学习时间。模型具有一定的泛化能力。

Nov, 2023