- WaterMono: 水底自助单目深度估计的教师引导异常遮蔽和增强提升
WaterMono 是一个用于深度估计和图像增强的新型框架,针对水下场景中的挑战,通过采用教师引导的异常掩模、深度信息结合水下图像成像模型生成增强图像以及旋转蒸馏策略来提高模型的鲁棒性,从而有效地实现了深度估计和图像增强任务。
- DualContrast: 无监督分离内容和变换的隐式参数化
我们开发了一种名为 DualContrast 的新型自监督方法,专门用于解决与形状相关的图像数据集中的内容和变换的无监督分离问题。我们的广泛实验证明了 DualContrast 相对于现有的自监督和显式参数化方法的优越性。我们利用 Dual - CVPR通过局部形状变换学习 SO (3) 不变的语义对应关系
提出了一种自我监督的旋转不变三维对应学习器,在具有挑战性的类内差异和任意方向下学习建立形状间的密集对应关系。
- BRAVEn: 提升自我监督的视觉和听觉语音识别预训练
我们提出了 BRAVEn,这是对最近的 RAVEn 方法的扩展,完全从原始的音频 - 视觉数据中学习语音表示。我们的修改使得 BRAVEn 在各种环境中成为自我监督方法中的领先者,并且我们通过增加大量未标记数据观察到有利的扩展行为。我们的结 - CVPRT-VSL: 混合环境下的文本引导视听源定位
我们提出了一种利用 Tri-modal joint embedding 模型通过文本模态作为中间特征引导,在多源混合中分离语义音视源对应关系的 T-VSL 框架,该方法在训练期间通过预测混合中声音实体的类来引导细粒度的音视源对应关系的分离, - ACLHILL:层次感知的信息无损对比学习用于层次文本分类
探索自我监督学习在层次化文本分类中的可行性,并提出一种信息无损对比学习策略:HILL,以保留输入样本中的语义和句法信息并在学习过程中进行融合,实验证明其优越性。
- 大型语言模型引导的时间序列异常检测的知识蒸馏
通过知识蒸馏,以大型语言模型 (LLM) 为基础训练的教师网络来训练学生网络以检测时间序列异常,利用原型信号和合成异常样本的策略,AnomalyLLM 在 15 个数据集中表现出最先进的性能,在 UCR 数据集中提高了至少 14.5% 的准 - 自监督学习用于图像超分辨率与去模糊
自监督方法在各种成像逆问题中最近证明了几乎与监督方法一样有效,在科学和医学成像应用中为基于学习的方法铺平了道路,其中获得地面真实数据难度或费用较高,在磁共振成像和计算机断层扫描中就是这种情况。然而,现有方法在图像超分辨率和去模糊问题中无法取 - 简单但有效的无监督分类指定领域影像:以真菌影像为例研究
一种无监督分类方法,在特定领域的图像分类中,通过使用预训练模型和流形学习进行双重特征降维、多种聚类算法的投票机制以及事后标注而不是事前手动标注,成功地提高了分类准确率,降低了对预先标注数据集的依赖,从而实现了数据分类的闭环,并给各个领域的研 - ICCV高效的自监督人体姿势估计与归纳先验调整
简化中文摘要:本文探讨了改善自监督人体姿势估计的方法,包括分析重建质量与姿势估计准确性的关系,提出了一个优于基准模型的模型流水线,使用不到三分之一的训练数据量,并提出了一种适用于自监督环境的度量,用于衡量预测身体部位长度比例的一致性。结果表 - 重新思考对比学习的样本选择:潜在样本的挖掘
对比学习中通过综合考虑正负样本以及使用软硬权重策略来挖掘样本,分析并挖掘接近正样本的潜在负样本,相较于传统的自监督方法,该方法在 CIFAR10、CIFAR100 和 TinyImagenet 上分别达到了 88.57%、61.10% 和 - FSD:快速自监督单一 RGB-D 到分类三维物体
通过多阶段训练管线,我们的方法成功地在实时运行中克服了现有自监督方法在 3D 物体识别方面的限制,并在 NOCS 测试集上的 6D 姿态估计中取得了 16.4% 的绝对改进,同时以接近实时的 5 Hz 速度运行。
- IJCAI多智能体强化学习的自监督神经元分割
提出了一种基于决策的掩蔽图像模型(drawing-based mask image model, MIM)方法,利用强化学习自动搜索最佳图像掩蔽比例和掩蔽策略,并通过多主体协作捕捉体素间的依赖关系,从而在神经元分割任务上显著优于其他自我监督 - ICCV语义与时间关联:视频中自监督目标中心学习
自我监督方法在学习高层语义和低层时间对应方面取得了显著进展,本文在此基础上进一步探索了整合这两个特征以增强以对象为中心的表示的可能性。我们提出了一种新颖的语义感知遮蔽插槽注意力模型,通过融合语义特征和对应关系图,有效地识别多个对象实例,达到 - 自监督对抗性遮掩在 3D 点云表示学习中的应用
介绍了一种新型的自对抗方法 PointCAM,用于学习 3D 点云的遮罩函数,相较于之前的方法取得了更优秀的结果。
- 稳定对比强化学习:离线目标达成技术
通过对比强化学习问题的先前对比方法,我们发现,结合谨慎的权重初始化和数据增强,使用浅而宽的架构可以显著提高这些对比强化学习方法在挑战性的模拟基准测试中的性能,并且可以通过这些设计决策解决实际的机器人操作任务。
- 非对称式补丁采样用于对比学习
本文提出了一种新的不对称补丁采样策略,用于对比学习,以进一步增强外观不对称性以获得更好的表示,并在 COCO 数据集上实现了最先进的物体检测和实例分割性能。
- 遥测生理测量的自监督掩蔽自编码器预训练
本文提出了一种针对远程光电容积图 (rPPG) 的自监督学习方法,以提取生理信号中固有的自我相似性先验,并探索了一种特定的抗干扰策略以减少动作和光照的干扰,实现了较好的性能。
- StableRep: 文本到图像模型的合成图像为强视觉表示学习者
本研究探讨使用由文本到图像模型生成的合成图像学习视觉表示的潜力,提出一种多正对比学习方法,称为 StableRep。使用 20M 个合成图像训练的 StableRep 表现优于使用相同文本提示和对应真实图像的 SimCLR 和 CLIP 学 - 自监督学习中谱嵌入与矩阵补全的桥接
这篇研究论文从 Laplace 算子的角度出发,探讨了现代自监督表征学习方法中使用的一系列损失的理论基础,将数据扩充的感性偏置与低秩矩阵完成问题联系起来,利用低秩矩阵完成结果分析了现代自监督学习方法的收敛性及影响其下游性能的重要属性。