- 改进样本相似性图的对比学习中的 $\mathbb {X}$- 样本对比损失
通过修改相似性图表以明确样本之间的关系,我们重新设计了标准对比损失函数,以获得更好的表征学习,它在视觉模型中优于自监督学习和视觉语言模型,同时鼓励模型学习将对象与其属性和背景分离。
- 探索自我监督学习中数据集多样性对于外科计算机视觉的影响
近十年来,计算机视觉在微创手术中的应用迅速增加。尽管如此,相比病理学和放射学等其他医学领域,手术计算机视觉的影响仍然有限,主要原因是代表性注释数据的稀缺性。本研究调查了自我监督学习(SSL)中数据集多样性在手术计算机视觉中的作用,并比较了特 - IJCAI对于准周期时间序列来说,对比学习并非最优选择
通过引入非对比的方法 Distilled Embedding for Almost-Periodic Time Series (DEAPS),该论文在准周期时间序列中展示出更好的性能,并提供了一个 Gradual Loss 函数来指导模型捕 - LLM 对齐技术综述:RLHF、RLAIF、PPO、DPO 等
该研究旨在填补知识空白,通过将论文分类为不同主题并详细解释每种对齐方法,帮助读者全面了解领域的当前状况。
- 基于同一主体自监督学习的联邦学习用于人脸识别
通过联邦学习和自我监督学习,在个性化面部识别中,构建了一个新的模型适用于训练个性化的面部识别模型,并获得了比之前方法更好的性能。
- MedMAE:医学影像任务自我监督的骨干网
通过使用医学图像的大规模无标签数据集和自监督学习技术中的 Masked 自编码器,我们提出了一种用于医学图像任务的预训练模型,其在四个不同的医学图像任务中表现优于现有的预训练模型。
- ECCV自超视爽细粒度视知辨学习从合成化量特征
自我监督学习在各种任务中成为获取视觉表示的重要方法,然而在细粒度视觉识别中的应用受到区分细微差异的复杂任务的挑战。为了克服这一挑战,我们引入了一种新策略,通过生成的数据对引导模型专注于细粒度视觉识别所关键的区分性特征,从而增强自我监督学习提 - 语音处理的线性复杂度自监督学习
本文研究了一种线性复杂度的自监督学习(SSL)上下文编码器,通过改进 SummaryMixing 模型,在 MP3S 基准测试的下游任务中达到更好或相等的性能,将 wav2vec 2.0 模型的预训练时间和峰值 VRAM 分别减少了 18% - 自监督表示学习的可辨识性
自监督学习与监督学习之间存在显著差距,本文分析了自监督学习方法中特征学习存在的拥挤问题,并提出了动态语义调整器 (Dynamic Semantic Adjuster) 作为解决方案,通过在特征空间中对样本进行聚合和分离,最终缩小了自监督学习 - VR 头显编码头像的通用面部编码
实时面部动画是虚拟现实中头像介导的遥感交流的核心;本文提出一种在头戴式虚拟现实设备上实时生成真实面部动画的方法,包括无监督学习、跨视角重建、表情校准机制和改进的参数化方法,通过与之前的面部编码方法对比,实验证明本方法在数量和质量上都取得了显 - MM关于判别神经网络中的多样性
该论文介绍了一种神经网络架构,利用多种多样性原则,在 MNIST 上实现了 99.57% 的自我监督学习准确率,并且在 CIFAR-10 上实现了 94.21% 的半监督学习准确率(每类仅使用 25 个标签)。
- SafePowerGraph: 针对传输电力网络的安全评估图神经网络
电力系统中的图神经网络安全导向框架及其在电力网运行中的性能评估和优化问题的重要性。
- 深入研究基于自监督预训练的图像分类性能评估
自我监督学习方法是一种机器学习方法,通过解决预设任务,通过数据本身提供监督,从而避免了对外部标签的需求,并能够有效利用大量廉价无标签数据进行模型训练,从而显著降低了昂贵或无法获取标签的模型训练成本。本研究主要针对自我监督学习方法中的评估协议 - 关系表示蒸馏
知识蒸馏是从大型训练模型向更小、更高效的学生模型转移知识的有效方法,我们引入了关系表示蒸馏(RRD),该方法利用配对相似性来探索和强化教师模型和学生模型之间的关系,通过放宽的对比损失方法,改善了学生模型的鲁棒性和性能,且在 CIFAR-10 - 自监督音频掩码自编码神经网络的普适音频分离
本研究提出了将预训练的自监督模型(音频掩码自动编码器,A-MAE)整合到通用音频分离系统中以提高分离性能的方法,并在 AudioSet 数据集上进行了实验,结果表明本方法成功提高了最新的 ResUNet-based USS 模型的分离性能。
- ECCV具有明确聚类平衡的高效无监督视觉表示学习
提出了 ExCB 框架,采用一种新颖的聚类平衡方法,通过调整聚类分配来平衡相对大小,并在线解决了大批量需求和规模问题。通过广泛实验验证,ExCB 在资源需求降低、可扩展性和稳定性方面取得了显著的效果。
- 联合嵌入预测架构用于自监督学习的蒙版分类架构
使用 Mask-JEPA,一种自监督学习框架,结合遮罩分类器与联合嵌入预测架构,能有效地捕捉复杂的语义和精确的物体边界;通过在 ADE20K、Cityscapes 和 COCO 等数据集上进行严格评估,展示了 Mask-JEPA 的竞争性结 - 增强的自监督学习用于多模态 MRI 分割和分类:一种避免模型崩溃的新方法
通过建立和验证多模态磁共振成像数据的屏蔽自编码器,包括混合屏蔽图样和金字塔巴洛双胞胎模块,我们解决了自我监督学习中多模态磁共振成像的模型崩溃和低准确率的挑战。实验结果表明,我们的框架在分割和分类性能上显著提升,并支持对小病变区域的准确检测。
- 面向规模感知的具有 Transformer 的全环绕单目深度
通过自我监督方法同时从多个相机视角学习,全方位单目深度(FSM)方法能够更实用地预测相对尺度感知的深度,本论文致力于提高 FSM 方法对尺度感知的改进,从深度网络结构优化和训练流程优化两个方面进行改进,结果表明,所提出的 SA-FSM 方法 - 用于人口统计公平的自监督学习流水线的面部属性分类
该研究论文提出了一种完全自助式流水线用于人口统计学公平的面部属性分类器,通过利用预训练编码器伪标记的完全无标签数据、多样化的数据策划技术和基于元学习的加权对比学习,在现有基准基础上显著提高了下游图像分类任务中面部属性分类的公平性能。