Jul, 2023
DialogStudio: 朝着最丰富和最多样化的对话人工智能统一数据集收集
DialogStudio: Towards Richest and Most Diverse Unified Dataset
Collection for Conversational AI
TL;DRDialogStudio是最大最多样化的对话数据集合,它包含了开放域对话、任务导向对话、自然语言理解、对话推荐、对话总结和知识为基础的对话。该数据集合不仅为对话研究和模型训练提供了丰富多样的资源,还提供了每个数据集的许可证并为选定的对话设计了领域感知的提示来促进指导感知的微调。此外,使用DialogStudio数据集合开发的对话AI模型在零样本学习和少样本学习的实验中展现出卓越的性能。访问此链接获取与DialogStudio相关的所有数据集、许可证、代码和模型,以提高透明度并支持数据集和任务基础的研究以及语言模型的预训练。