Apr, 2022

在低资源环境中使用合成数据进行对话响应生成

TL;DR本研究发表了名为 PEx Conversations Dataset 的第一个菲律宾会话数据集,并介绍了使用 Tagalog RoBERTa 模型增加现有 corpora 大小的数据增强方法,最后发布了能够生成相关前三个回复的第一个菲律宾会话响应生成器,并成功地将合成数据与人类数据结合使响应生成器的性能提高了 12.2%。