Sep, 2023

XGen-7B 技术报告

TL;DR我们训练了 XGen,这是一系列包含 70 亿参数的模型,可支持长度达 8K 的序列,同时通过公共领域的指导数据进行了微调,与最先进的开源 LLMs 相比,在标准基准测试和长序列建模任务中表现出可比或更好的结果。