BriefGPT.xyz
Ask
alpha
关键词
instruction tuning framework
搜索结果 - 2
从零开始预训练轻量级大型语言模型 MindLLM: 评估与领域应用
MindLLM 是一系列双语轻量级大型语言模型,通过从头开始训练模型以减轻培训和部署大型语言模型的负担并解决资源不足问题。该论文提供了大模型开发过程中的经验,并介绍了适用于较小模型的创新指令调整框架,同时探索了 MindLLM 在法律和金融
→
PDF
8 months ago
使用双编码器改进场景文本编辑的扩散模型
DIFFSTE 是一个改善预训练扩散模型性能的双编码器设计框架,通过指令调整训练,实现了场景文本编辑中正确文本渲染和风格控制的任务,使其具有零 - shot 泛化能力。
PDF
a year ago
Prev
Next