Apr, 2021

利用紧凑型Transformer逃离“大数据”范式

TL;DR本论文提出了一种名为紧凑型Transformer(CCT)的方法,并证明使用恰当的大小和卷积记号化技术,可以在小型数据集上避免过度拟合并优于现有卷积神经网络(CNNs)的表现,从而使得Transformer在应对较小的数据集、资源受限和数据效率方面有了新的突破。