Jan, 2024

DrBERT: BERT预训练中揭示掩码语言模型解码器的潜力

TL;DR提出了多个增强的解码器设计,并引入了DrBERT(经过解码器优化的BERT)作为一种新方法进行模型训练,通过微调对原始BERT模型的解码器进行改进,有效提高了模型性能而不增加推理时间和资源使用。