BriefGPT.xyz
Ask
alpha
关键词
diverse pre-training datasets
搜索结果 - 1
SPECTRUM: 面向长对话概述的说话者增强预训练
在本文中,我们提出了一种用于长对话摘要的说话者增强的预训练方法,该方法利用了多轮对话的内在结构。我们通过收集多样化的数据集,并进行预训练,实验证明我们的模型在具有长上下文的基准测试中取得了最先进的性能,超过了基准模型,并突出了我们方法的有效
→
PDF
5 months ago
Prev
Next