- 基于注意力过滤的医学图像分割的多维 Transformer
提出了一种面向医学图像分割的多维注意力变换器 (MDT-AF) 方法,通过重新设计补丁嵌入和自注意机制来解决医学图像分割中存在的低信噪比和特征表示容量有限的问题,并取得了当前最先进的性能。
- 动态特征学习与匹配用于类增量学习
在这篇论文中,我们从三个角度提出了动态特征学习和匹配(DFLM)模型,分别是引入类别权重信息和非平稳函数来调整训练过程中对内存的关注,利用 von Mises-Fisher(vMF)分类器有效建模动态特征分布并隐式学习其判别性质,以及通过最 - FORESEE: 癌症生存鲁棒预测的多模态和多视图表示学习
一个新的端到端框架 FORESEE,通过挖掘多模态信息来稳健地预测患者生存情况,同时利用细胞水平、组织水平和肿瘤异质性水平的丰富语义特征,解决了多模态数据的缺失问题,并通过交叉尺度特征融合方法,提高了病理图像特征表征能力。
- 突破异构联邦学习的内存墙:逐步训练
通过分割模型结构,分阶段训练并冻结模型的不同部分,逐步减小模型的尺寸以降低内存占用,从而提高性能。
- FSMR:一种基于特征交换的多模态推理方法,结合文本和视觉线索
该论文介绍了一种名为特征交换多模态推理(FSMR)模型的方法,通过特征交换来增强多模态推理,提供了图像和文本的有效特征表示,并加强了模型对图像和文本之间相互作用的理解,通过多模态交叉注意机制实现了文本和视觉信息的联合建模,实验证明 FSMR - AAAI通过关注特征规范提升少样本学习
基于多样性正则化的少样本学习旨在通过混合来自不同类别的两个样本及其融合因子的方法,提高对有限训练样本的新颖对象的识别能力。然而,这种混合操作通过线性插值和忽视特定通道的重要性削弱了特征表示。为了解决这些问题,本文提出了一种注意力特征正则化( - 电子健康记录的多模态分析上的对比学习
该研究提出了一种新颖的多模态特征嵌入生成模型,并设计了一种多模态对比损失函数,通过联合分析结构化和非结构化数据的两种重要模态来捕获患者的完整病历,从而实现多模态电子健康记录特征表示学习并保护隐私。模拟研究结果表明,所提出的算法适用于多种配置 - Castor:用于快速准确的时间序列分类的竞争形状片段
通过组织 shapelets 并使其在不同时间上竞争来构建多样的特征表示,Castor 算法利用 shapelets 对时间序列进行转换,通过广泛的实证研究证明 Castor 提供了比多个最先进的分类器更准确的转换,并且在广泛的消融研究中, - 音频线索加强的音频视觉分割引导
提出了 AVSAC 方法,通过构建双向音频 - 视觉解码器并采用二向桥接设计,实现了音频线索的增强和音频与视觉模态之间的连续交互,从而缩小模态不平衡、促进整合音频 - 视觉表示的有效学习。此外,提出了音频 - 视觉帧同步策略,通过更好的同步 - 使用监督对比学习学习标签层次
我们介绍了一种 Label-Aware SCL 方法,通过利用类别之间的相似性,将层次信息融入到 SCL 中,从而创建一个更结构化和具有辨别性的特征空间,实现了更好的文本分类性能。
- 人物再识别的互相蒸馏学习
利用深度学习技术和互相协同的特征提取方法,本文提出了一种名为 Mutual Distillation Learning For Person Re-identification(简称 MDPR)的新方法,以从多个角度解决人物再识别问题并提高 - 零样本主动学习基于自监督学习
提出了一种新的无关模型且无需迭代过程的主动学习方法,利用自监督学习的特征表示来进行数据注释以提高深度学习模型的泛化性能。
- 基于深度学习的情感分类:一个比较调查
深度学习方法在情感分析问题的解决中起到了关键作用,而这篇论文通过对超过 100 种基于深度学习的情感分类方法在 21 个公开数据集上的比较,将性能影响因素分为三类,并量化地解释了它们对研究中方法的影响。
- FedFN:解决联邦学习中的数据异质性问题的特征正态化
研究通过实验证明 FedFN 学习方法在训练模型时依然可以保持高效性能,尤其在面对数据异质性和特征表征等问题时表现优异。
- SENetV2:用于通道和全局表示的聚合稠密层
本文介绍了一种通过与密集层结合的聚合多层感知机,用于改进现有体系结构,提高高级特征表示能力的方法。通过对基于图像分类的现有体系结构进行实验比较,结果表明该方法显著提高了分类准确度。
- 通用策略的不变因果模仿学习
基于多个环境中的行为演示来学习模仿策略,通过学习跨域不变的特征表示,构建与专家行为匹配的模仿策略,以实现在未见环境中的泛化能力。
- 图卷积与混合操作的等价性
本研究探讨了图卷积和 Mixup 技术之间的关系。研究发现,在两个条件的基础上,图卷积可以被视为一种在训练和测试阶段都应用的特殊形式的 Mixup。这两个条件分别是:1)同质重标签 - 将目标节点的标签分配给其所有邻居;2)测试时间 Mix - 利用主成分分析探索神经网络的学习表示
对深度神经网络的特征表示进行理解仍然是可解释人工智能领域中一个开放问题。本研究使用主成分分析(PCA)来研究在 CIFAR-10 上训练的 ResNet-18 的逐层学习表示对 k 最近邻分类器(k-NN)、最近类中心分类器(NCC)和支持 - 音频差异学习用于音频字幕
该研究介绍了一种新颖的训练范式,音频差异学习,用于改进音频字幕生成。该方法通过创建一个保留音频关系的特征表示空间,能够生成详细描绘复杂音频信息的字幕。实验证明,该方法在 Clotho 和 ESC50 数据集上,相较传统方法,SPIDEr 分 - 基于潜在类别识别的长尾图像分类 LCReg
通过深度学习技术,本研究提出了一种新的长尾图像识别方法,通过学习共享的隐含特征来改进特征表征,并在这些特征上进行语义数据增强,以提高训练样本的多样性,显著改善了基线模型。