BriefGPT.xyz
Ask
alpha
关键词
document-level tasks
搜索结果 - 4
长文分类器中的无监督理性抽取:大海捞针
这篇论文针对长篇文本的语言模型,研究了其对 token-level 预测准确性的影响,提出了使用 RoBERTa 分析句子的组合式软注意力架构来提取 plausible rationales 的方法,并发现相比 Longformer 驱动的
→
PDF
a year ago
人类语言建模
本文介绍了一种针对人类语言的建模方法 —— 人类语言建模(HuLM)及其大规模变形器模型 HaRT。研究表明,HaRT 不仅可以有效地预测社交媒体上的语言模型,而且对于文档和用户级别的任务具有良好的适应性和先进水平。
PDF
2 years ago
ACL
ERNIE-Doc: 一种用于回顾性长文档建模的 Transformer
提出了基于具有回归的 Transformers 的文档级语言预训练模型 ERNIE-Doc,借助回顾性馈送机制和增强的回归机制,提高了其处理长文档数据的能力。实验证明,在英文和中文文档级任务上,ERNIE-Doc 在文本分类和问题回答等任务
→
PDF
4 years ago
语言模型预训练用于层次文档表示
从无标注数据中预训练了一种能够包括来自整个文档的上下文信息的分层文档表示,包括定长的句子 / 段落表示,并应用于文档分割、文档级问答和抽取式文档摘要等方面取得了有效结果。
PDF
5 years ago
Prev
Next