零样本跨语言实体链接中的跨语言转移
本文引入了 Parameter-Selective Mean Teacher (PSMT) 方法,通过选择性的蒸馏机制在学生模型中利用过去知识对新知识进行正则化,以减轻错误积累的影响;同时,在教师模型中通过 Fisher 信息创建掩码来有选择性地更新参数,并应用保存措施于关键参数,以避免灾难性遗忘,实验证实 PSMT 在多个基准数据集上优于现有方法。
Jul, 2024
本文提出了一种基于伪标签和领域适应(无监督学习)的跨域文本隐写分析方法(PDTS),通过使用预训练的 BERT 和单层 Bi-LSTM 来学习和提取任务间通用特征,并生成特定任务表示。通过选择性特征传播来增强分类性能,并通过自训练使用未标记的目标领域数据和伪标签来训练模型。实验结果表明,我们的方法在零样本文本隐写分析任务中表现出色,在没有目标域标记数据的情况下实现高检测准确率,并优于当前的零样本文本隐写分析方法。
Jun, 2024
该论文考虑了域漂移下的模型选择问题,并提出了一种基于核 k-means 聚类的数据分割算法,该算法最大化训练集和验证集之间的最大平均差异 (MMD),提高选定模型的泛化能力,该技术在一系列数据集和训练算法中一直表现优于其他分割策略,适用于域广义化和无监督域适应任务。分析还表明,训练集和验证集之间的 MMD 与测试域准确性强烈相关($\rho=0.63$),进一步证实了这种方法的有效性。
May, 2024
通过引入一种新颖的基于扩散的边界精化方法,利用激光雷达点环绕粗糙边界框的无域扩散模型来同时精化边界框的位置、尺寸和方向,克服了现有模型在应用于具有不同传感器设置或地理位置的领域时面临的性能不稳定问题,从而在不同数据集、目标类别和检测器上实现了显著的改进。
May, 2024
通过增强 Swin Transformer,我们的模型 SwinFUSE (Swin 多模态融合的无监督增强) 在医学影像领域从不同的影像模态中学习,提升了下游性能,并展现出了对领域变化的适应性以及显著的泛化能力。
May, 2024
在跨领域目标检测中,本文引入了一种名为 Versatile Teacher (VT) 的新型教师 - 学生模型,通过考虑类别特定的检测难度并采用两步赋值机制,生成更可靠的伪标签,将其作为显著性矩阵来引导区分器进行有针对性的实例级对齐,取得了有希望的实验结果,并扩展了广泛使用的一阶检测器的对齐方法,具有重要的实际应用潜力。
May, 2024
跨群体整合多组学单细胞数据的新方法,通过学习统一细胞表达,实现无需全模态参考样本的跨域关系和特征填充,为单细胞聚类、分类和特征填充等任务提供了稳健的解决方案。
May, 2024
在这篇论文中,我们提出了一种基于信息瓶颈原理和不变风险最小化框架的新方法,旨在提取紧凑且信息丰富的特征,以具备对领域转移和语义转移具有强大泛化能力的同时,在传输过程中保持紧凑性。我们在图像分类任务上的大量模拟结果表明,该方案优于当前的最先进方法,并实现了更好的率失真权衡。
May, 2024
本文提出了一种名为 PARDEN 的方法,通过要求模型重复自己的输出来检测和减少 Large Language Models(LLMs)的安全风险,该方法在监测入狱风险方面明显优于现有方法。
May, 2024