Apr, 2024

Nyonic技术报告

TL;DR最新的自定义大语言模型的开发和关键成就,包括支持灵活调整训练数据和课程学习的新式在线数据调度器,采用最新的技术,如旋转位置嵌入、QK-LayerNorm和特制的多语言分词器来增强稳定性和性能。此外,我们的强大训练框架还结合了先进的监控和快速恢复功能,以确保最佳效益。我们的Wonton 7B模型在多种语言和英语基准测试中表现出竞争力。未来的发展将优先缩小与更广泛训练模型之间的性能差距,从而提高模型在实际中的效力和适应性。