Mar, 2024

InternLM2 技术报告

TL;DRInternLM2 是一种开源的大型语言模型,通过创新的预训练和优化技术,在多个维度和 30 个基准测试中优于之前的模型,并在长文本建模和开放主观评估方面取得突出表现。该模型通过精心设计的预训练过程,使用了包括文本、代码和长文本数据在内的多种数据类型,并具备捕捉长期依赖、高效处理任务的能力。此外,通过释放不同训练阶段和模型大小的 InternLM2 模型,为社区提供了对模型演进的深入理解。