EMNLPSep, 2020
数据集制图:利用训练动态映射和诊断数据集
Dataset Cartography: Mapping and Diagnosing Datasets with Training Dynamics
Swabha Swayamdipta, Roy Schwartz, Nicholas Lourie, Yizhong Wang, Hannaneh Hajishirzi...
TL;DR使用 Data Maps 工具基于模型的训练动态量化和诊断数据集。实验结果表明,数据地图揭示了数据集中的模糊、易于学习和难以学习的区域,这些发现对于构建健壮的模型和提高分布外泛化能力非常重要。