Feb, 2024

DE$^3$-BERT: 基于原型网络的 BERT 增强距离提前退出

TL;DR基于全局信息与局部信息的混合策略,我们提出了一个新颖的基于距离增强的 BERT 模型早停策略 (DE^3-BERT),通过利用全局信息来提高预测准确性,从而在模型性能和推理效率之间取得更好的平衡。