Jan, 2024

DrBERT: BERT 预训练中揭示掩码语言模型解码器的潜力

TL;DR提出了多个增强的解码器设计,并引入了 DrBERT(经过解码器优化的 BERT)作为一种新方法进行模型训练,通过微调对原始 BERT 模型的解码器进行改进,有效提高了模型性能而不增加推理时间和资源使用。