Feb, 2023
READIN:一个包含真实和多样化输入噪音的中文多任务基准
READIN: A Chinese Multi-Task Benchmark with Realistic and Diverse Input Noises
Chenglei Si, Zhengyan Zhang, Yingfa Chen, Xiaozhi Wang, Zhiyuan Liu...
TL;DR为了确保模型的鲁棒性和公正性,构建一个具有真实输入噪声的中文多任务基准测试 READIN,包含四个不同的任务,使用拼音输入和语音输入,实验表明现有的强大的预训练语言模型即使使用了鲁棒性方法,如数据增强,也会在 READIN 上显著降低性能。