使用预训练字向量对卷积神经网络进行训练,支持 fine-tuning 并结合静态和动态字向量,以提高句子级分类准确率并在多项基准测试中超越现有技术。
Aug, 2014
通过综合文献和自行实验,我们发现在单标签和多标签分类任务中,与精调的语言模型和 MLP 等标准机器学习方法相比,基于图的方法效果不如人意,甚至有时比基于词袋的 MLP 方法表现还要差,这进一步挑战了过去几年中新基于图方法的开发和它们在这一领域中的实际价值,并证实了预先训练的语言模型依然是文本分类中最先进的方法。因此,未来的文本分类研究需要仔细测试标准的机器学习算法如 MLP,以更好地评估其真正的科学进展。
Apr, 2022
本文旨在研究使用不同神经网络和通用与领域特定词嵌入的应用能力,以提高推文分类模型的性能,结果表明 Bi-LSTM 模型使用通用词嵌入(如 GloVe)效果最佳,最高可达 62.04%的 F1 分数。
Mar, 2019
本文使用卷积神经网络并采用单词嵌入技术,通过对 Yelp 2017 挑战数据集业务评论进行多次实验处理,取得了与传统方法相当的分类效果。
Oct, 2017
通过改进 Paragraph Vector 的架构,使其可以学习预测单词和 n-gram 特征的文档向量,捕捉了文档中的语义和单词顺序,从而在 IMDB 电影评论数据集上实现比其他模型更好的情感分类结果,同时保持了向量的表达能力。
Dec, 2015
本文提出了一种基于多模态的深度学习框架,用于短文本多类别分类,针对于极小数据集,使用了 DISTILBERT 来获取上下文敏感的动态词向量,并取得了在精度、召回率、准确率和 F1 分数上与现有最优方法相同的性能,同时模型体积更小,可以在移动设备上更快、更轻地部署。
Jun, 2022
本文研究了神经网络在多标签分类中的应用,并提出了一种使用深度学习算法的简单神经网络模型取代 BP-MLL 模型进行文本分类,证明了这些模型在六个不同属性的数据集上具有较好的性能表现。
Dec, 2013
使用深度学习模型和集成模型对社交媒体上的越南文本进行分类,实现了比之前研究更好的性能。
Sep, 2020
ML-Net 是一个新型的深度学习框架,用于多标签分类生物医学文本,它通过组合标签预测网络和自动标签计数预测机制来在输出标签时利用每个标签的预测置信度和目标文档中的上下文信息,无需人工特征工程,具有高效、可扩展等特点。
Nov, 2018
通过将两通道卷积神经网络与环状网络相结合,建立了一种多模态情感识别方法,该方法可以有效提取情感信息并提高学习效率。实验表明,基于特征融合的情感分析方法能够有效提高情感数据集的识别准确性,并减少学习时间。模型具有一定的泛化能力。
Nov, 2023