ACLApr, 2021

预训练语言模型中的记忆与泛化

TL;DR本研究通过研究先进的预训练语言模型在嘈杂和低资源环境下的一般化和记忆能力,发现这些模型的训练对标签噪声几乎没有影响,但并不适用于低资源任务,而基于原型网络的扩展则能提高识别低资源命名实体时的性能。