- RE-AdaptIR: 逆向工程的改进信息检索适应性
通过使用未标记的数据,我们研究了倒向工程适应信息检索 (RE-AdaptIR) 的有效性,以改进只使用未标记数据的基于大语言模型的信息检索 (LLM-based IR) 模型, 并且展示了在培训领域和未见过查询的领域中性能的改善。
- 深度无处不在:通过透视蒸馏和无标签数据增强提升 360 度单目深度估计
360 度图像的深度估计是虚拟现实、自主导航和沉浸式媒体应用中至关重要的,本研究提出了一种使用未标记 360 度数据的深度估计框架,通过六面立方体投影技术生成伪标签来高效标注 360 度图像的深度,并在深度估计的准确度上展示了显著改进,特别 - ICML候选伪标签学习:通过无标签数据及时调整以增强视觉 - 语言模型
通过候选伪标签学习方法(CPL)在下游任务中使用适当的候选伪标签细调视觉 - 语言模型(VLMs),以提高 VLMs 在大量无标签数据上的 True 标签包含能力和类别平衡实例选择效果。
- MakeSinger: 一种用于数据高效的半监督训练方法的歌声合成,通过无分类器扩散引导
通过无分类器扩散引导的 MakeSinger 半监督训练方法,提高合成的歌声质量,并展示即使在无歌声数据的情况下,通过训练文字转语音 (TTS) 数据的模型仍可以合成 TTS 说话者的歌声。
- 无标签条件下适应分布偏移的适应性符合性预测
通过两种新方法 ECP 和 EACP,根据基模型在未标记测试数据上的不确定性调整 CP 中的评分函数,从而仅使用测试域中的未标记数据改进 CP 生成的预测集的质量。通过对许多大规模数据集和神经网络架构进行广泛实验,我们展示了我们的方法相对于 - 自监督特征适应的广义半监督学习
通过提出自监督特征适应(SSFA)方法,解决了传统半监督学习在标记和未标记数据分布不一致时预测错误伪标签的问题,从而提高了半监督学习性能。
- 深度安全半监督学习下的多样化师生对应策略
半监督学习能够通过利用未标记的数据显著提高模型性能,然而,现实世界的未标记数据往往包含看不见类别的样本,这可能阻碍对已知类别的分类。为解决这个问题,我们引入了一个名为 Diverse Teacher-Students (DTS) 的新型框架 - 释放无标签数据的力量:智能电网中用于网络攻击检测的自监督学习框架
提出了基于自监督学习的框架用于检测和识别各种类型的网络攻击,该框架利用大量未标记的感知数据中的隐式模式来学习具有概括性和有效性的表示,同时结合少量标记数据训练特定任务的分类器,以及提出了一种新的损失函数来解决现实世界中训练数据不平衡的问题, - 面向半监督医学图像异常检测的空间感知注意力生成对抗网络
应用空间感知注意力生成对抗网络 (SAGAN) 对医学图像异常检测进行半监督生成,通过定位编码和注意力机制精确聚焦于修复异常区域并保留正常区域,利用生成的健康图像与原图像的差异作为异常分数,实验证明 SAGAN 在三个医学数据集上的性能优于 - 图像转伪情节:通过无标签数据增强少样本分割
使用未标记数据生成伪序列的一种新方法,可提高少样本分割模型的泛化能力,取得了准确性方面的最新成果。
- MaskMatch:基于 Mask 自编码特征学习的半监督学习增强
半监督学习中存在数据利用有限的挑战,本研究介绍了一种全新的算法,利用未标记数据来提升半监督学习的性能,并取得了最先进的结果。
- 辨别式自监督学习方法综述
计算机视觉领域的自监督学习是从无标签数据中提取强大特征的方法,模型通过自动从数据本身中推导标签而无需人工注释。本文全面回顾了计算机视觉领域内的自监督学习的判别性方法,包括对比、自蒸馏、知识蒸馏、特征去相关化和聚类技术,并研究这些方法如何利用 - 文本识别的自我监督预训练
本文研究了文档文本识别的自监督预训练方法,探索了利用未标记数据的方法,并提出了基于掩码标签预测的自监督预训练方法,以及联合嵌入方法和模型崩溃预防技术。通过在历史手写和历史印刷数据集上的实验表明,自监督预训练在目标领域数据上非常有效,但在与之 - IJCAIVCC-INFUSE: 半监督学习中准确高效的未标记样本选择
我们提出了两种方法:Variational Confidence Calibration (VCC) 和 Influence-Function-based Unlabeled Sample Elimination (INFUSE),VCC - 增量自训练半监督学习
本研究提出了增量自训练(IST)用于半监督学习,通过在模型稳定后处理决策边界附近的数据,优化分类器性能,并在五个数据集和两种基础模型上验证,取得了显著的识别准确率和学习速度的提升,超越了现有最先进方法三个具有挑战性的图像分类任务。
- CVPR利用视觉语言模型进行零样本分类的标签传播
本文介绍了一种基于标签传播和测地线距离的方法 (ZLaP),利用未标记数据的图结构进行零样本分类,并提出了一种高效的归纳推理方法。
- 野外半监督无约束头部姿态估计
通过利用大量未标记的野外头部图像,我们提出了第一个半监督的无约束头部姿势估计(SemiUHPE)方法,该方法可以应对多样性和复杂性较高的头部姿势领域,并使用动态熵过滤来自适应地去除未标记的异常值,并通过两种新的面向头部的强增强技术进一步提高 - CVPR释放无标签数据:跨视角地理定位的范例
本研究探讨了大范围视角交叉地理定位(CVGL)中无标签数据的有效利用,包括无监督和半监督设置。我们提出了一个无监督框架,其中包括交叉视角投影来指导模型检索初始伪标签,并通过利用 “完全配对的地面 - 卫星图像位于一个独特且相同场景” 的事实 - 无地面真值的跨视图视觉地理定位学习
在本研究中,我们提出了一种自监督学习框架,通过仅利用无标签数据训练一个可学习的适配器,将不同视角的特征分布映射到一个统一空间,以应对交叉视图地理定位中的挑战。实验证明,我们的方法在减少训练参数和仅仅依靠无标签数据的情况下,相较于标准模型和有 - CT 图像中基于 CLIP 的强健 COVID-19 检测
通过使用冻结的 CLIP 图像编码器和可训练的多层感知器(MLP),本研究提出了第一个轻量级检测器,旨在克服医学成像领域,特别是 COVID-19 检测领域所面临的诸多挑战,如广泛的计算资源、缺乏良好注释的数据集和大量未标记的数据。此外,我