Nov, 2021
SynthBio: 人工智能和人类协作构建文本数据集的案例研究
SynthBio: A Case Study in Human-AI Collaborative Curation of Text Datasets
Ann Yuan, Daphne Ippolito, Vitaly Nikolaev, Chris Callison-Burch, Andy Coenen...
TL;DR本文提出一种利用大型语言模型实现高效数据集筛选的新方法, 用于构建结构化属性列表描述虚构人物的评估数据集 SynthBio,与 WikiBio 数据集相比更少噪声且更平衡。