BriefGPT.xyz
Jul, 2020
预训练BERT网络的彩票票证假设
The Lottery Ticket Hypothesis for Pre-trained BERT Networks
HTML
PDF
Tianlong Chen, Jonathan Frankle, Shiyu Chang, Sijia Liu, Yang Zhang...
TL;DR
本文采用彩票票据假说来研究预训练的 BERT 模型是否存在可训练的、可转移的子网络,发现在一些任务上存在符合条件的子网络,这些子网络在初始化时即可被找到,其中在与预训练任务相同的任务上找到的子网络具有普适的迁移性,而在其他任务上找到的子网络则具有有限的迁移性。
Abstract
In
natural language processing
(NLP), enormous
pre-trained models
like
bert
have become the standard starting point for training on a rang
→