BriefGPT.xyz
Ask
alpha
关键词
multi-task neural networks
搜索结果 - 2
多任务神经网络共享与任务特定参数的轮替训练
该论文介绍了一种用于训练难参数共享的多任务神经网络的新型交替训练程序,该方法通过交替更新共享权重和任务特定权重,利用模型的多头架构,从而降低计算成本,增强训练规范化,并提高泛化性能。实证实验表明,该交替训练程序延迟过拟合,提高了预测准确性,
→
PDF
6 months ago
ACL
BAM! 自然语言理解的再生多任务网络
使用知识蒸馏和教师退火的方法,可帮助多任务神经网络训练并超越单任务神经网络,文中使用该方法在 GLUE 基准测试上成功的提升了 BERT 的多任务微调性能。
PDF
5 years ago
Prev
Next