Jun, 2024

具备 MAD 技能的预训练混合模型

TL;DRManticore 是一个自动化设计混合体系结构的框架,通过重用预训练模型创建预训练混合体,实现了语言模型选择、预训练混合体的构建以及对预训练混合体进行编程的功能,并在长距离竞技场任务上取得强大的性能。