Jul, 2024

JEPA如何避免噪声特征:深度线性自蒸馏网络的隐式偏差

TL;DR通过分析深度线性模型的训练动态,揭示了预测隐藏空间中的显著特征对于Joint Embedding Predictive Architecture(JEPA)方法成功的隐含偏差机制。