Aug, 2023

PIPPA:一个部分合成的对话数据集

TL;DR使用大语言模型进行日常对话和角色扮演应用的研究已经引起了广泛的兴趣,为了解决现有会话和角色扮演数据集的不足,我们推出了一个名为 PIPPA(人类与人工智能之间的个人互动对)的半合成数据集,该数据集由一群角色扮演爱好者参与的社区驱动的众包努力的结果。该数据集包含 1 百万个话语,分布在 26,000 个对话会话中,为研究人员和人工智能开发者在角色扮演场景中探索和优化会话型人工智能系统提供了丰富的资源。