Feb, 2022

使用预训练语言模型集成的简答评分

TL;DR本研究探讨了利用 Kaggle 自动化短问题评分数据集,通过微调一系列的小型、基础型、大型预训练 Transformer 语言模型,并训练一个特征模型来测试这些模型的集成的有效性。观察到较大的模型通常表现稍好,但它们仍无法自己达到最优结果,只有通过大量网络集成才能产生最优结果,但这些集成过于庞大,无法应用于实际生产环境。