- S4:自主监管跨频谱感知
利用卫星图像时间序列(SITS)的自监督预训练方法 (S4),通过利用波段差异和地理信息进行预训练任务,从而显著降低对标记训练数据的需求,为 SITS 分割任务提供了一种有效且能使用有限标记数据的解决方案。
- CVPR通用少样本遥感:基于混合语义分割框架的地貌涵盖映射中的新类发现
提出了一种名为 SegLand 的广义少样本分割框架,用于在高分辨率土地覆盖映射中更新新颖类别,实验表明该框架在有限标记数据下自动更新新颖土地覆盖类别方面具有优越性。
- 基于内部和外部不确定性的特征聚合模型,用于半监督组织病理图像分割
提出了一种新的基于不确定性正则化的半监督学习方法,利用像素级标注的有限性和图像预测不确定性来改进分割模型,通过多尺度和多阶段特征融合实现了更好的性能。
- AAAIKG-TREAT:利用知识图谱协同患者数据预训练的治疗效果估计
通过利用大规模的观察性病人数据和生物医学知识图谱,本文提出了一种新型的预训练和微调框架 KG-TREAT 来增强治疗效果评估,该方法构建了双重关注的知识图谱并整合了深度双层关注协同方法,通过对病人数据和知识图谱的深入信息融合,能够对治疗相关 - AAAI半监督图表示学习与以人为中心的解释预测脂肪肝病
在临床环境中,尤其是在脂肪肝疾病的预测中,本研究探讨了在半监督学习框架内利用图表示学习的潜力,通过构建主题相似度图以从健康检查数据中识别风险模式。我们展示了各种图神经网络方法在这一背景下的有效性,即使只有有限的标记样本。我们的方法的核心是通 - 标签高效的多器官分割方法与扩散模型
本研究提出了一种使用预训练扩散模型进行 CT 图像的多器官分割任务的标签高效学习方法,该方法仅需要少量标记数据,在有限标记数据场景下取得了竞争性的分割性能。
- 利用视觉基础模型,高效训练小型任务专用模型
利用大型视觉基础模型(VFMs)通过在庞大数据集上预训练,以及在有限标记的目标数据下展现出优异性能的情况下,提出了一种简单高效的面向任务的知识迁移方法,用于对小型任务特定模型进行有效训练。实验结果表明,该方法在有限标记数据的情况下,在四个目 - KDD如何通过主动学习在半监督图像分类中克服确认偏倚
活跃学习和半监督学习在有限标记数据的真实世界应用中结合的潜力为在真实世界应用中使用有限标记数据进行学习的鲁棒方法提供了新的方向。
- ICCV半监督实例分割的伪标签对齐
PAIS 是一种新的框架,针对半监督实例分割问题,通过调整半监督损失项的权重,使得伪标签包含宝贵信息不被过滤掉,实验证明,PAIS 在标注数据极为有限的情况下具有很大的潜力,仅有 1% 的标注数据时,基于 Mask-RCNN 的 PAIS - SLPT:基于限制标签的病变分割的选择性标定与提示调整
使用深度学习进行医学图像分析时,由于有限的标记数据和高昂的注释成本,往往面临挑战。本文提出了一种将选择性标记与提示调整相结合的框架(SLPT),以提高有限标签下的性能,同时保持预训练模型不变,通过仅使用有限标记数据对这些参数进行更新。该框架 - ICCV本地或全局:有限标签下的选择性知识综合联邦学习
在本研究中,我们提出了 FedLabel 方法,该方法可以在标签有限的本地数据情况下,通过全局模型或本地模型对未标记数据进行伪标记,进而利用全局模型和本地模型的知识,通过全局 - 本地一致性正则化提高模型的泛化能力,它不需要额外的专家、通信 - 基于分数的条件生成:自校准分类器引导下使用较少标记数据
通过将分类器作为 SGM,并利用少量标记数据,提供条件生成。
- 神经启动用于样本高效自适应
提出了神经启动技术,可适应大型预训练模型中少量标记样本的分布漂移和下游任务,在测试数据上进行轻量级更新,显著提高了分布转移和转移学习基准测试的准确性。
- 尴尬地简单的时间序列混合
提出了两种新的数据增强方法 MixUp++ 和 LatentMixUp++,分别通过对原始时序数据和分类模型的潜在空间进行插值,实现半监督学习来扩充标记数据,从而在两个公共数据集上显著提高了 1% - 15% 的时间序列分类精度。
- CVPR基于词汇信息的零样本学习和开放集学习
该研究提出了一种基于语义流形的加权最大间隔框架解决零样本学习中面临的挑战,包括有限标记数据、大量标签分类和开放集分类。在 Animal with Attributes 和 ImageNet 数据集上,模型表现得到了显著提高,类词汇量最高可达 - 低资源跨语言命名实体识别的双重对比框架
本篇论文提出了一种名为 ConCNER 的新颖双重对比框架,针对有限来源语言标注数据的跨语言命名实体识别问题,通过翻译对数据进行增广,并利用对比学习和知识蒸馏的方法,提高模型的性能。
- 自然语言处理中有限数据学习的数据增强实证调查
本文旨在系统评估了在有限标注数据情境下的 Natural Language Processing(NLP)中数据增强方法的进展和方法景观,总结了包括标记级别增强、句子级别增强、对抗性增强和隐藏空间增强等多种方法并在 11 个数据集上实验,分 - KDD半监督协同注意力网络结合内外部信号实现 COVID-19 虚假推特的早期检测
本篇工作提出一种利用外生和内生信号进行早期 COVID-19 推特假新闻检测的模型 ENDEMIC,该模型利用图嵌入和上下文特征来聚合传播信息,采取半监督学习方式解决有限标注数据的挑战,最终结果更优越。
- AAAI互信息准则的主动特征选择
本文针对标签信息有限的情况,提出了基于互信息和纯探索多臂老虎机的主动特征选择算法,并通过实验证明了其有效性。
- 利用薄弱的社交监督检测假新闻
本文探讨如何利用社交媒体生成弱社交监督来缓解标签数据的匮乏问题,并以社交媒体上的假新闻检测为例,展示了弱社交监督在面对标记数据问题时的有效性,为其他新兴任务学习提供了新思路。