BriefGPT.xyz
大模型
Ask
alpha
关键词
long document classification
搜索结果 - 5
面向长文档分类的长度感知多核心变换器
长篇文档分类方面的研究中,我们提出了一种适应长文档的多核变换器(LAMKIT),通过使用多样化的基于变换器的核心来编码长篇文档,以解决上下文边界和文档长度差异性带来的问题,并通过这些核心向量化文本长度以提高模型的稳健性。在健康和法律领域的五
→
PDF
2 months ago
因果关系是你所需要的
本文提出了 Causal Graph Routing(CGR)框架,通过干预机制揭示数据中隐藏的因果关系,并在计算机视觉和自然语言处理领域的任务中超过当前最先进方法,具有建立具有因果性的预训练大规模模型的潜力,以在更广泛的语义空间内提高机器
→
PDF
7 months ago
模型融合是否有助于长文档分类的 Transformer?实证研究
通过比较模型融合与 BERT 和 Longformer 架构的结果,研究探讨了在长文档分类中采用模型融合的方法。
PDF
a year ago
EMNLP
重新审视基于 Transformer 的长文档分类模型
本研究使用稀疏注意力机制和分层变换器方法,对基于 Transformers 的长文本分类进行比较,探讨了四个文本分类数据集,并得出了实际应用此方法的实用建议。
PDF
2 years ago
ACL
使用 Transformer 高效分类长文档
本文提供了一个广泛的长文本分类的基准测试方法,包括二分类、多分类、多标签分类任务,研究发现更复杂的模型并不总是优于简单的基准模型,并且在不同数据集上表现不稳定,因此需要未来研究考虑更全面的基准模型和数据集以开发出更为稳健的模型。
PDF
2 years ago
Prev
Next