BriefGPT.xyz
Ask
alpha
关键词
generator-discriminator
搜索结果 - 1
ACL
预训练语言模型作为多角度课程学习者
本文针对 ELECTRA 预训练生成器与判别器训练时出现的单调训练和交互不足的问题,提出了一种多角度课程学习(MCL)算法。该算法通过将 MLM 缺点和标注标签平衡考虑在内的三个自监督课程设计,解决了单调训练和标签不平衡等问题。由于判别器与
→
PDF
a year ago
Prev
Next