BriefGPT.xyz
大模型
Ask
alpha
关键词
mixed data distributions
搜索结果 - 1
DEM:混合数据分布训练的分布编辑模型
提出了一种简单和高效的方法,使用基本的逐元素向量操作将每个数据源上单独训练的模型与基本模型相结合,从而更好地优化数据源,得到一种名为分布编辑模型(DEM)的模型,与标准数据混合相比廉价 11 倍,并在各种基准测试中优于强基准,对大小为 3B
→
PDF
13 days ago
Prev
Next