May, 2023
使用大型语言模型生成真实的合成数据:计算社会科学案例研究
Generating Faithful Synthetic Data with Large Language Models: A Case Study in Computational Social Science
Veniamin Veselovsky, Manoel Horta Ribeiro, Akhil Arora, Martin Josifoski, Ashton Anderson...
TL;DR该研究论文介绍了采用基于 grounding、过滤和分类系统的生成方法来提高合成数据的准确性,并在讽刺检测任务中对比研究了三种方法以提高准确性,评估证明 Grounding 方法更为有效,该研究提供了合成数据高保真性的一些建议。