Jun, 2023

数据饮食中的 NLU: 动态数据子集选择用于 NLP 分类任务

TL;DR本研究提出了一种基于动态数据修剪的方法,使用 EL2N 度量和初始微调阶段,在保持完整准确性的同时,可将数据量减少 50%~80% 以大大减少微调时间,并在 GLUE 基准测试和四个联合 NLU 数据集上展现出更好的时间 - 准确性平衡。