Mar, 2023

PRESTO: 一个用于解析现实任务导向对话的多语言数据集

TL;DR本研究介绍了 PRESTO,这是一个基于 550K 个虚拟助手和人之间的上下文多语言对话的公共数据集,用于研究语言理解的挑战性问题,包括流畅性、代码切换和修订等。mT5 模型在该数据集上的表现证明了其中的语言现象具有挑战性,尤其在低资源情况下。