Jul, 2023
预训练语言模型在非分布数据上的扩散效应是如何影响的?
How Does Diffusion Influence Pretrained Language Models on Out-of-Distribution Data?
Huazheng Wang, Daixuan Cheng, Haifeng Sun, Jingyu Wang, Qi Qi...
TL;DR使用 Transformer 预训练语言模型(PLMs)中的扩散模型降低了离群值鲁棒性,并提供了对离群样本的强力检测能力。