- 通过使用模拟数据来减少数据采集和标记以进行缺陷检测
使用合成数据与未标注的真实数据进行训练可在较低成本下实现与标注真实数据相媲美甚至更好的缺陷检测结果。
- 基于伪标签的领域适应用于零样本文本隐写分析
本文提出了一种基于伪标签和领域适应(无监督学习)的跨域文本隐写分析方法(PDTS),通过使用预训练的 BERT 和单层 Bi-LSTM 来学习和提取任务间通用特征,并生成特定任务表示。通过选择性特征传播来增强分类性能,并通过自训练使用未标记 - 基于聚类的领域泛化验证划分
该论文考虑了域漂移下的模型选择问题,并提出了一种基于核 k-means 聚类的数据分割算法,该算法最大化训练集和验证集之间的最大平均差异 (MMD),提高选定模型的泛化能力,该技术在一系列数据集和训练算法中一直表现优于其他分割策略,适用于域 - DiffuBox:基于点扩散的三维物体检测优化
通过引入一种新颖的基于扩散的边界精化方法,利用激光雷达点环绕粗糙边界框的无域扩散模型来同时精化边界框的位置、尺寸和方向,克服了现有模型在应用于具有不同传感器设置或地理位置的领域时面临的性能不稳定问题,从而在不同数据集、目标类别和检测器上实现 - Swin Transformer 的自监督跨模态预训练
通过增强 Swin Transformer,我们的模型 SwinFUSE (Swin 多模态融合的无监督增强) 在医学影像领域从不同的影像模态中学习,提升了下游性能,并展现出了对领域变化的适应性以及显著的泛化能力。
- 多功能教师:一种面向跨领域适应的课程感知教师 - 学生框架
在跨领域目标检测中,本文引入了一种名为 Versatile Teacher (VT) 的新型教师 - 学生模型,通过考虑类别特定的检测难度并采用两步赋值机制,生成更可靠的伪标签,将其作为显著性矩阵来引导区分器进行有针对性的实例级对齐,取得了 - 不完整调性下的群体间单细胞数据联合分析
跨群体整合多组学单细胞数据的新方法,通过学习统一细胞表达,实现无需全模态参考样本的跨域关系和特征填充,为单细胞聚类、分类和特征填充等任务提供了稳健的解决方案。
- 应用信息瓶颈解决任务导向通信中的分布偏移问题
在这篇论文中,我们提出了一种基于信息瓶颈原理和不变风险最小化框架的新方法,旨在提取紧凑且信息丰富的特征,以具备对领域转移和语义转移具有强大泛化能力的同时,在传输过程中保持紧凑性。我们在图像分类任务上的大量模拟结果表明,该方案优于当前的最先进 - ICMLPARDEN,你能重复一遍吗?通过重复防御越狱
本文提出了一种名为 PARDEN 的方法,通过要求模型重复自己的输出来检测和减少 Large Language Models(LLMs)的安全风险,该方法在监测入狱风险方面明显优于现有方法。
- 高阶邻域信息更多:超图学习与无源无监督域自适应
提出了一种新的基于超图学习的无源无监督领域自适应方法,通过探索多个样本之间的高阶邻域关系和考虑域偏移效应,实现了对目标样本的分类,并在多个数据集上进行了广泛实验验证。
- 现代 UDA 算法中的超度现象
神经网络面对与其训练集不同的陌生数据时,存在域偏移的问题,现有的解决方法包括不加监督的域适应和确定性提取等,但它们往往会导致模型的过度确定性现象,本文提出了一种增加准确性并保证模型校准的不加监督域适应算法,适用于计算资源有限的环境。
- 混合领域半监督医学图像分割中构建和探索中间域
医学图像分割中存在有限标注和领域转移的问题,传统的半监督分割和无监督领域自适应方法只解决了其中一个问题,本文提出了一种新的具有挑战性的情景:混合领域半监督医学图像分割(MiDSS),并通过引入统一的复制 - 粘贴(UCP)和对称引导训练策略 - 使用深度学习远程光电容积脉搏模型相似性测量领域转变
通过模型相似性来衡量领域偏移的指标可用作领域偏移的度量,并且我们展示了这些指标与实际性能之间的高相关性。其中一项具有可行相关性的提议指标为 DS-diff,不需要假设对目标领域的基本事实,即可应用于自然环境数据。因此,我们研究了一个模型选择 - ACLMSciNLI:科学自然语言推理的多样基准
科学自然语言推理(NLI)的任务涉及预测从研究文章中提取的两个句子之间的语义关系。本文介绍了多样性科学 NLI 任务,并提出了 MSciNLI,这是一个包含 132,320 个从五个新科学领域中提取的句子配对的数据集。通过精调预训练语言模型 - 逐层早停机制用于测试时间适应
通过引入 Layerwise EArly STopping (LEAST) 和使用一种新的基于梯度的度量来衡量当前学习特征对新域的相关性,我们提出了一种解决 Test Time Adaptation (TTA) 中保持学习新特征和保留预训练 - 跨领域多模态少样本目标检测:基于丰富文本
我们提出了一种多模态小样本物体检测方法,利用丰富的文本语义信息作为辅助模态来实现领域自适应,通过多模态特征聚合模块和丰富的文本语义校正模块增强模型的语言理解能力,实验证明该方法明显优于现有的小样本物体检测方法。
- 高效组装归一化层和规范化方法用于联邦领域泛化
基于归一化方案的 gPerXAN 是一种新颖的架构方法,通过个性化显式组装归一化和简单而有效的正则化,解决了领域偏移问题,并在多个基准数据集和一个真实医疗数据集上表现优于其他现有方法。
- 利用合成数据改进胎儿 MRI 中的跨领域脑组织分割
FetalSynthSeg 是一种基于 SynthSeg 的领域随机化方法,用于通过磁共振成像(MRI)对胎儿脑进行分割,研究结果表明,在跨领域数据验证中,仅使用合成数据训练的模型表现优于仅使用真实数据训练的模型,并且在不同磁场强度和超分辨 - ZoDi: 基于扩散的图像转换的零样本领域自适应
本文提出了一种基于扩散模型的零样本领域自适应方法,名为 ZoDi,它具有两个设计特点:零样本图像转换和模型自适应。通过利用现成的扩散模型将源图像的领域转移到目标领域,我们首先合成目标领域的类似图像,以维持布局和内容,然后在训练模型时使用源图 - PALM: 推动自适应学习率机制以进行连续的测试时间自适应
通过在不依赖于伪标签的情况下,通过模型预测不确定性的量化来识别层,以克服先前方法的局限性;在 CIFAR-10C、CIFAR-100C 和 ImageNet-C 等标准测试数据集上进行了详细的图像分类实验,证明了我们方法的功效。