BriefGPT.xyz
大模型
Ask
alpha
关键词
discourse understanding
搜索结果 - 3
DEPTH:分层预训练的议程教育
深度是一个编码器 - 解码器模型,通过在预训练过程中引入面向语篇的目标来提高语言模型在语篇层面上的理解能力。通过结合层次化的句子表示和两个目标:句子重排和跨度破坏,深度能够更快地学习语义和语篇级别的表示,从而拓展了 T5 在语篇能力方面的表
→
PDF
2 months ago
跨文本类型论证挖掘:语言模型自动填补缺失的话语标记?
为了提高不同类型文本中的 Argument Mining 系统的鲁棒性,我们提出了自动使用连贯性标记来增加输入文本的方法,以便明确标记所有关系,并发现即使是现成的最流行的语言模型在这项任务上也会失败。
PDF
a year ago
ACL
语言模型中的实体跟踪
本文探讨了大语言模型在跟踪实体状态和关系变化方面的能力,发现只有预训练于大量代码的 GPT-3.5 模型具有此能力,而使用预训练于文本的较小模型进行微调后也可以完成一定程度的实体追踪。但这种能力不仅取决于模型的大小,大文本库的预训练也不是必
→
PDF
a year ago
Prev
Next