May, 2022

CPED:用于对话 AI 的大规模个性化和情感中文对话数据集

TL;DR研究表明,说话者的个性和情感对对话有重要影响,因此考虑个性和情感的影响对于对话生成非常重要。为了解决这个问题,我们提出了 CPED: 一个大型、个性化和情感化的对话数据集,包含了与移情和个性特征相关的多源知识,涵盖性别、大五人格特质、13 种情感、19 种对话行为和 10 个场景。该数据集包含了来自 40 个电视节目的 392 个说话者的 12,000 多个对话,是新一代对话人工智能研究的新开放基准。