Dec, 2022

SODA: 百万级社交常识语境下的对话压缩

TL;DR本文提出了SODA数据集,该数据集包含100万个高质量的社交对话,利用该数据集训练了COSMO,一个可推广的谈话代理,在域内和域外数据集上表现优异,同时进行了广泛的评估,并与以前最优秀的谈话模型进行了比较,结果表明COSMO在未知数据集上表现更加自然和一致。