关键词multi-label document classification
搜索结果 - 5
- 多标签文档分类的学习部分权重
多标签文档分类中,我们通过引入学习部分权重(LSW)的新方法,能够更准确地处理科学文章等多种领域中的文本分类任务。我们的实验结果表明,相对于现有的方法,LSW 在公开(arXiv)和私人(Elsevier)数据集上取得了显著优势,分别在宏平 - Hawk:一款工业级多标签文档分类器
论文描述了经典的多标签文档分类的不足之处,提出了一种解决方案:通过基于句子级别嵌入的神经网络架构,实现能够处理可变长度文本和杂乱文档,具有模块化、可视化、操作不平衡数据和可扩展性等特点,并通过基准测试数据集 Web of Science、B - 零样本学习的灵活工作分类
本文重点研究了零样本多标签文档分类在人力资源领域的实际税分类扩展情景下的应用,实验表明,相对于传统的多标签分类器,零样本分类器可以实现 12% 的平均精度(macro-AP)的增长。另外,本文还提出了采用推荐系统领域中的筛选 / 重排序分解 - COVID-19 文献的分类
本研究分析了多个多标签文档分类模型在 LitCovid 数据集上的表现,发现在该数据集上微调过的预训练语言模型表现最佳,并探讨了其数据效率和可推广性,同时也提出了未来研究中需要解决的问题,数据和代码均在 GitHub 上可获取。
- 多标签文档分类的统计主题模型
本文探讨生成性统计主题模型在多标签文档分类中的应用,相对于判别性模型,在包含大量稀有标签和高度倾斜标签分布等实际数据集的分类问题中有优越性。实验结果表明,相较于判别性方法,概率生成模型在多标签分类方面表现优异。