May, 2022

ProsocialDialog: 会话代理人的亲社会支撑

TL;DRProsocialDialog是第一个大规模的多轮对话数据集,用于教授对话代理在遵循社会准则的情况下回应不安全的用户话语。该数据集包括58K个对话,331K条话语和160K个唯一的RoTs,并配有497K个对话的安全标签。通过人工智能协作框架创建,该数据集提出了一种对话安全检测模块Canary,以及社交感知的对话代理Prost,这些都能有效地引导对话代理和现成的语言模型生成更多的亲社会回应。