一个概率模型解释自监督表示学习
自我监督学习 (SSL) 是一种有效的方法,可以从大规模无标签数据中学习表示,对时间序列分析显示出有希望的结果。本文从对比和生成两个主要流派对比研究了时间序列中的自我监督表示学习。我们首先介绍了对比和生成 SSL 的基本框架,并讨论了如何获得指导模型优化的监督信号。然后,我们分别为每种类型实现了经典算法 (SimCLR vs. MAE),并在公平的环境中进行了比较分析。我们的结果提供了每种方法的优势和劣势的见解,并为选择合适的 SSL 方法提供了实用的建议。我们还讨论了我们研究结果对更广泛的表示学习领域的影响,并提出了未来的研究方向。所有的代码和数据都在 https://github.com/DL4mHealth/SSL_Comparison 发布。
Mar, 2024
本文深入分析了自监督学习的机制以及其对表示学习的影响,揭示了自监督学习在样本聚类方面的潜在驱动作用,同时证实了该方法所训练的表示与语义类别之间存在着密切的对齐关系,并且这种对齐关系随着训练和网络深度的加深而不断增强,这对于提高自监督学习方法的性能和效果具有重要的理论和实际意义。
May, 2023
本文提出了一种基于谱流形学的统一框架,以解决自监督学习方法的局限性并提供有意义的表示学习方法,通过将 VICReg,SimCLR 和 BarlowTwins 等自监督学习方法与谱方法相对应,得到了闭合形式的最佳表示以及线性区间内的网络最佳参数,并揭示了对训练中使用的成对关系以及下游任务性能的影响,以及对于两种谱嵌入方法之间的第一种理论桥梁的暗示。
May, 2022
本文提出了一种基于潜在图预测的自我监督学习框架 LaGraph,通过其理论上的自我监督上界来学习预测未观察到的潜在图。在实验中得到了相对于其他相关方法在性能上的提高和对样本减少的鲁棒性提升的证明。
Feb, 2022
本文研究自监督学习在传感器人体活动识别中的应用,并分析了两个最近的自监督学习框架 SimCLR 和 VICReg 的深层表示,比较了监督和自监督模型对输入数据噪声的鲁棒性,并通过可解释性方法探索了 SSL 和监督表示中编码的性质。研究表明,自监督学习表示比监督模型更加鲁棒,但监督模型学习到的特征更加均匀且更好地编码了活动的性质。
Apr, 2023
利用自监督学习方法提升视觉地理定位技术性能和训练效率,通过统合 SimCLR、MoCov2、BYOL、SimSiam、Barlow Twins 和 VICReg 等多种自监督学习方法,研究训练策略和参数设置对视觉地理定位任务的适应性
Jul, 2023
提出了一种新的理论框架来理解对比自监督学习方法,该方法采用双重 ReLU 网络(例如 SimCLR)。我们证明了每个 SGD 更新中的权重是由协方差算子更新的,并进一步说明了协方差算子的作用和应用。通过建立层次潜变量树模型并证明深度 ReLU 网络的隐藏层学习了该模型的潜变量,我们总结了通过对比自监督学习的初始随机选择法放大而形成的层次化特征。
Oct, 2020