Jan, 2024

CC 查询:从公共语料库中发掘大规模领域特定知识

TL;DR通过大语言模型引导的数据收集方法 Query of CC,我们构建了高质量的知识数据集 Knowledge Pile,包括数学和知识相关推理能力测试,并开源了我们的数据集和代码,为学术界提供有价值的支持。