Apr, 2023

异常样本微调

TL;DR本研究介绍了一种系统的数据集修剪方法,通过测量语句间的距离和词频分布的协变距离,筛选出 10500 个有效的样本,经过微调 ELECTRA 的训练可达到比使用全部 87000 个样本训练的模型更好的性能。