Nov, 2022

通过认知神经网络进行语言模型微调

TL;DR本文提出在大规模语言模型上加入 epinet 网络架构以取得 epistemic neural network (ENN) 优化的结果,使用该方法在 GLUE 任务中,不仅可以达到和 BERT 相同的性能表现,还能使用少两倍的数据。同时,该方法在神经网络生成模型中也表现良好,优于启发式主动学习方法。