Dec, 2022

SODA: 百万级社交常识语境下的对话压缩

TL;DR本文提出了 SODA 数据集,该数据集包含 100 万个高质量的社交对话,利用该数据集训练了 COSMO,一个可推广的谈话代理,在域内和域外数据集上表现优异,同时进行了广泛的评估,并与以前最优秀的谈话模型进行了比较,结果表明 COSMO 在未知数据集上表现更加自然和一致。