Feb, 2021

捕获标签分布:自然语言推理案例研究

TL;DR研究了自然语言推理任务中固有人类分歧 (注释标签分布) 的估计。通过后处理平滑预测的标签分布以匹配期望的标签熵取得了很好的效果。同时,通过引入有多个参考的少量样例进行训练,相较于传统做法每个训练样本只采集一个参考,我们发现这种多参考的方法可以在固定注释预算下实现更好的精度。最后,提供了对比这两种方法的丰富分析,用于改进标签分布估计。