BriefGPT.xyz
Ask
alpha
关键词
long text classification
搜索结果 - 2
高效可解释长文本分类的多维感知器
该研究提出了一种名为 SWIPE 的模型,它可以有效地学习整个文本的标签,并以一种无监督的方式感知段落的标签并估计它们对文本标签的贡献,从而在长文本分类中实现了高准确度和模型解释性的突破。
PDF
a year ago
RoFormer: 带旋转位置嵌入的增强 Transformer
本篇论文研究了在语言模型中如何整合位置信息,并提出了一种名为 RoPE 的方法,它可以将位置信息编码为旋转矩阵,并同时将显式的相对位置依赖性结合到自注意力公式中。实验结果表明,RoPE 使 transformer 在处理长文本分类问题时表现
→
PDF
3 years ago
Prev
Next