Jun, 2023

研究预训练语言模型在跨领域数据集上,更接近通用人工智能的一步

TL;DR本文研究了预训练语言模型在领域任务泛化能力方面的能力,发现预训练模型在计算机视觉、蛋白质折叠预测等任务中表现出色,优于从头开始训练模型,并指出预训练嵌入在输入层非常重要。