BriefGPT.xyz
大模型
Ask
alpha
关键词
efficient pre-training
搜索结果 - 2
Cerebras-GPT:基于 Cerebras 晶片集群训练的优化开放式云算模型
通过高效的预训练和扩展、开放数据集和工具来改善大语言模型的最近研究进展;我们将这些进展结合起来,推出了 Cerebras-GPT,这是一个从 111M 扩展到 13B 参数的开放计算最优语言模型家族;我们在 Eleuther Pile 数据
→
PDF
a year ago
用于高效视频文本检索的掩码对比预训练
本文提出了一种简单而有效的视频 - 语言预训练框架,用于视频 - 文本检索任务,并采用掩蔽对比视频 - 语言预训练进行了优化,以提高预训练效率和性能,并实现了与图像 - 文本检索任务的竞争结果。
PDF
2 years ago
Prev
Next