Feb, 2023

READIN:一个包含真实和多样化输入噪音的中文多任务基准

TL;DR为了确保模型的鲁棒性和公正性,构建一个具有真实输入噪声的中文多任务基准测试 READIN,包含四个不同的任务,使用拼音输入和语音输入,实验表明现有的强大的预训练语言模型即使使用了鲁棒性方法,如数据增强,也会在 READIN 上显著降低性能。