May, 2024

MAmmoTH2:网络中的指令扩展

TL;DR我们提出了一种新的方法,通过从预训练的网络语料库中高效地收集 1000 万条自然存在的指导数据来增强大型语言模型 (LLMs) 的推理能力,从而显著提高了模型在推理基准测试中的性能,并在多个推理和聊天机器人基准测试中获得了最先进的性能。