Oct, 2023

WikiIns:一个高质量的数据集,用于通过自然语言指令进行受控文本编辑

TL;DR本论文研究了通过自然语言指令进行受控文本编辑的问题,并建立了高质量的 WikiIns 数据集以解决现有数据集的信息不足的问题。通过预处理维基百科编辑历史数据库,并进行众包验证和测试,以及小规模训练集的构建,还提出自动生成大规模 “银” 训练集的自动方法。通过对 WikiIns 数据集的分析和实验结果,可以促进文本编辑领域的研究。