Jul, 2024
看前或看周围?自回归与掩码预训练之间的理论比较
Look Ahead or Look Around? A Theoretical Comparison Between Autoregressive and Masked Pretraining
Qi Zhang, Tianqi Du, Haotian Huang, Yifei Wang, Yisen Wang
TL;DR通过建立理论框架,比较了两种主要生成式自监督学习范式 —— 自回归 SSL 和掩码 SSL 在分类和内容生成任务中的优势和局限性,并提出了多样性增强的自回归和可变长度掩码目标,显著提高了自回归 SSL 的分类性能和掩码 SSL 的生成性能。