Jan, 2024
CC 查询:从公共语料库中发掘大规模领域特定知识
Query of CC: Unearthing Large Scale Domain-Specific Knowledge from Public Corpora
Zhaoye Fei, Yunfan Shao, Linyang Li, Zhiyuan Zeng, Hang Yan...
TL;DR通过大语言模型引导的数据收集方法 Query of CC,我们构建了高质量的知识数据集 Knowledge Pile,包括数学和知识相关推理能力测试,并开源了我们的数据集和代码,为学术界提供有价值的支持。