BriefGPT.xyz
Ask
alpha
关键词
domain-specific corpora
搜索结果 - 3
通过阅读理解调整大型语言模型
我们研究了如何在特定领域的语料库上继续进行预训练,发现在原始语料库上进行训练赋予了模型领域知识,但严重损害了其对问题回答的提示能力。借鉴人类通过阅读理解进行学习的灵感,我们提出了一种简单的方法,将原始语料库转化为阅读理解文本。每个原始文本都
→
PDF
10 months ago
关于预训练语言模型 N-gram 逼近的研究
本研究调查了预先训练的语言模型在自动语音识别中的潜在用途,对比了大规模文本抽样和概率转换的应用。在八个特定领域的语料库中,发现采样的近似方法支持使用,插值与大规模文本语料库一起使用对比基线三元组能使测试困惑度提高 15%,我们引入了一种有限
→
PDF
a year ago
ACL
利用源条件掩蔽跨度预测提高词汇约束的神经机器翻译
本文提出了一种简单有效的训练策略,通过应用掩蔽跨度预测模型, 实现了对两种语言的三个特定领域语料库在术语级和句子级翻译方面的持续改进,以解决神经机器翻译系统术语翻译的实用性和可靠性问题。
PDF
3 years ago
Prev
Next