Nov, 2023
L3 集成:基础语言模型的终身学习方法
L3 Ensembles: Lifelong Learning Approach for Ensemble of Foundational Language Models
Aidin Shiri, Kaushik Roy, Amit Sheth, Manas Gaur
TL;DR提出了一种基于生命周期学习的方法,通过从未见过的数据中提取有意义的表示,构建结构化知识库,逐步提高任务性能,实验结果表明该方法相比于精调的基础语言模型可提高 4%~36% 的模型准确度,并在 STS 基准任务上表现出与 T5 模型相比具有竞争力或超越性能的优势(准确度提高 15.4%)。