ACLJun, 2023

LiveChat: 从直播流自动构建的大规模个性化对话数据集

TL;DR通过引入 1.33 亿真实的中文对话数据集 LiveChat,并提出基于先进技术的检索式基线方法,本研究在多方对话范围内针对回应建模和宾语识别等两个关键任务进行研究,并验证了利用人物特征和更大的平均会话数对任务的积极影响,同时还提出了当前挑战的未来方向。