- 自监督图像重建方法的样本复杂度分析
探究自监督训练方法的样本复杂度,发现模型的性能会随着训练样本数量增加而提高,证明采用自监督训练方法所需样本较多,但与监督训练方法优化模型的性能差距会随着样本数量增加而逐渐缩小。
- 基于槽位的物体中心模型对槽位数量的敏感性研究
在本研究中,我们通过对基于槽的方法进行系统研究,以解决槽的数量选择对学习对象相关表示的影响问题,我们发现槽的数量选错会导致过度或不足分割的问题,并探讨了目标函数和注释实例级别等因素对改善问题的影响。
- 无监督自主检测异常的不良土壤湿度传感器
本研究利用神经网络结合动态时间扭曲等技术,提出一种基于自我监督的异常传感器检测方法,成功解决了现有方法无法应对未标记、数量庞大的 IoT 数据中 “野传感器” 检测的难题,实现了在农业数据处理等领域中的实际应用。
- DINOv2: 无监督学习强韧可靠的视觉特征
本文提出了一种基于预训练和自监督方法的计算机视觉模型,该模型使用大量的数据自动构建一种多样的图像数据集,能够在各种任务和图像的情况下快速、高效地生成功能强大的视觉特征。
- CVPRNeRF-Supervised 深度立体
使用神经渲染技术构建的数据集来训练深度立体网络,使其能够预测锐利且详细的视差图,并在 Middlebury 数据集上优于现有的自监督方法。
- ICLR来自未标记视频的最近邻内部对比学习
该研究介绍了一种叫做 Inter-Intra Video Contrastive Learning (IIVCL) 的方法,利用来自全局空间的最近邻视频作为额外的正对。该方法提高了正关键图的多样性,并引入了一个更松散的相似性概念,扩展到了视 - 高效低计算自监督视觉模型的简单配方
本文介绍了一种简单的自监督蒸馏技术,可以培训高性能低计算的神经网络,RoB 通过从大型自监督教师模型到小型学生模型的知识蒸馏来实现,适用于许多架构。实验结果表明 RoB 在 ImageNet 数据集上表现良好,且在五个下游转移任务上的表现与 - CVPR混合声音源的本地化
我们提出了一种同时定位视觉场景中多个声源的方法,使用 Jabri 等人的对比随机漫步所启发的模型,并结合了视听相似性度量,能够较好地解决声音混合的分离与声音和视觉信号的联合问题,实验结果表明该模型在定位多个声源方面优于其他自监督方法。
- ECCVN2V2 -- 用改进的采样方法和微调的网络结构解决 Noise2Void 棋盘状伪影问题
本研究提出了两种改进的方法来减少 N2V 中产生的不良伪影,并通过测试表明,这两种方法可以推进图像去噪领域的全面自我监督技术的发展。
- 稀疏流形变换的极简无监督学习
本文介绍了一种基于稀疏流形变换的简单可解释无监督学习方法,通过可视化解释了无监督学习的表示变换,实现了接近 SOTA 方法的性能,同时与自监督方法密切相关,是一种很有前景的无监督学习方法。
- 音乐节奏估计的等变自监督
本文提出了一种基于等变自监督信号来学习音频节奏表示的方法,避免了需要标注数据的缺点,而且不需要采用正则化或负采样等方法防止模型崩溃。实验证明,这种方法能够仅依靠等变自监督而获得与监督方法相当的性能,而且需要的计算资源较少,因此适用于广泛的研 - ECCV自监督跨模态相互蒸馏的三维动作表示学习
本文提出了一种新的跨模态交互知识蒸馏框架 Cross-modal Mutual Distillation (CMD) 来学习自监督的三维动作表示,该框架中引入邻域相似性分布来建模每种模态中学到的知识,并使用非对称配置来稳定蒸馏过程和在模态之 - ICCVMonoIndoor++: 自我监督单目深度估计在室内环境中的更好实践
提出了一种基于 transformer 网络的深度分解模块、一个迭代的相机位置残差估计模块和一个直接进行坐标卷积编码的坐标引导策略,从而提高了自监督单目深度估计方法在室内环境中的性能。
- AAAI无监督神经语音表示学习概述
本文回顾了过去十年中无监督表示学习在语音处理领域的发展,归纳了自监督方法和概率隐变量模型这两类主要模型,提出了全面的分类方法,并讨论了这两类模型。
- 纯净半监督学习:在只有很少标记图像的情况下进行半监督学习
本文针对有限标注信息下的半监督学习进行研究,分析了当前应用最广的半监督学习方法 FixMatch 在这种情况下的表现和局限,提出了一种利用自监督学习方法提供训练信号以及优化伪标签筛选过程的方案,并在 STL-10 数据集上得到了显著提高。
- 自监督相关挖掘网络用于人物图像生成
本文提出了一种自我监督的相关性挖掘网络(SCM-Net),其中包括解耦样式编码器(DSE)和相关性挖掘模块(CMM),用于在特征空间中重新排列源图像,并使用图形分析的身体结构保持损失(BSR Loss)来提高生成效果。实验表明,相对于其他有 - ECCVRegionCL:简单区域交换是否有助于对比学习?
本文针对自我监督学习方法中图片裁剪技术的局限提出了一种叫做区域对比学习的新预处理方法,其通过最大程度利用所裁剪出的画面和其余部分来提高视觉表示的表现,并在 ImageNet,MS COCO 和 Cityscapes 等数据集上实现了最先进性 - 自监督和少样本目标检测综述
本文综述了近期研究的少样本和自监督目标检测方法,并提出了研究中的主要收获和未来方向。
- ICCV挖掘自监督单目深度估计的潜在能力
该研究提出一种新的数据增强方法(data grafting)、探索性自蒸馏损失函数(exploratory self-distillation loss)、和全尺寸卷积神经网络,以提高自监督单目深度估计的表示能力和性能表现,实验结果表明该模 - ICCV夜间环境下的规范化:高效的自监督单目深度估计算法
本文提出了一种新的单目深度估计框架,引入了基于先验的正则化来学习配准深度图像的分布知识以避免错误训练,并使用 Mapping-Consistent Image Enhancement module 来增强图像可视性和对比度,同时维持亮度一致