BriefGPT.xyz
Ask
alpha
关键词
educational knowledge
搜索结果 - 1
教育背景下集成强先验模块和数据重叠估计的三阶段 SFT 混合模型
我们提出了一个基于先验的端到端三阶段监督微调模型,它证明比传统的微调方法更有竞争力。我们的模型通过一个采样器和重叠估计神经网络来稳固三类数据分类,并将预处理数据集分三批注入预训练模型进行 LORA 微调。然后,我们设计了一个先验模块耦合系统
→
PDF
4 months ago
Prev
Next