BriefGPT.xyz
大模型
Ask
alpha
关键词
domain-specific continual pre-training
搜索结果 - 3
D-CPT 法:针对大型语言模型的领域专用持续预训练规模定律
基于尺度定律的领域特定持续预训练法 (D-CPT Law) 可用于预测不同尺寸的语言模型的理想混合比例,以及交叉领域的 D-CPT Law 可用于目标领域的预测,不同尺寸和数据集尺寸的训练成本相对较低。
PDF
a month ago
通过持续预训练构建金融领域特定的日文大语言模型
此研究旨在通过不断预训练的方式构建一种针对日本金融领域的特定大型语言模型,并证明该模型在日本金融基准测试中的性能优于原始模型。研究表明,针对特定领域的不断预训练也对大型语言模型具有有效性。调整后的模型现已在 Hugging Face 平台上
→
PDF
3 months ago
EcomGPT-CT: 具有半结构化数据的电子商务大型语言模型的连续预训练
大型语言模型(LLMs)预先训练在海量语料库上,在各种 NLP 任务中展示了出色的性能。本文针对特定领域应用这些模型仍然存在着显著挑战,如缺乏领域知识、有限的领域知识利用能力和不足的领域特定数据格式适应能力。因此,本研究聚焦于以电子商务领域
→
PDF
6 months ago
Prev
Next