Jun, 2024

评估 ChatGPT 生成的好、坏和丑陋的论证:一个新的数据集、方法论和相关任务

TL;DR本论文介绍了一种从 ChatGPT 生成的论述性文章中提取好的、坏的和丑陋的论点的方法,并描述了一个包含多样化论证的新颖数据集 ArGPT。我们评估了数据集的有效性并为几个与论述相关的任务建立了基线。最后,我们展示人工生成的数据与人类论证之间的关联,证明其可以作为训练和测试系统所定义任务的工具。