- 基于心电图的心血管疾病检测的计算高效半监督学习
基于心电图(ECG)进行心血管疾病检测的深度学习系统在自动化领域面临的主要挑战是标记稀缺问题。我们提出了一种高计算效率的半监督学习范式(FastECG),以提供具有强大计算效率和鲁棒性的 ECG 心血管疾病检测方法,并在四个 ECG 数据集 - 语言模型是否能使用预测策略?
深度学习系统在图像分类、基本编程和标准化测试中已经达到或超过了人类的准确率。然而,在预测未来事件的能力上,模型仍然难以取得准确的结果。本研究使用了一种新颖的真实世界事件数据集和相关的人类预测,提出了一个评估指标来衡量预测能力,并对不同基于 - ICML概念模型中的概念关系理解
使用人类可以理解的概念构建解释的基于概念的可解释性方法为深度学习系统提供了洞察力。通过分析基于概念模型学习的概念表示,我们发现现有的方法缺乏稳定性和鲁棒性,无法准确捕捉概念间的关系。因此,我们提出了一种新算法,利用概念间的关系来提高概念干预 - 隐私保护的深度学习:基于可变形算子进行安全任务学习
在云计算和数据驱动应用的时代,保护敏感信息以维护数据隐私是至关重要的,因此,保护深度学习系统中的隐私成为一个关键问题,本研究提出了一种使用一组可形变操作符进行安全任务学习的新型隐私保护框架,在模拟 - 数字转换过程中对像素进行打乱以生成视觉 - 揭示异常:保护图像分类免受对抗性贴纸攻击
我们提出了一种防御机制,利用聚类技术 DBSCAN 来分离异常图像片段,并通过三阶段流程对敌对噪声进行定位和减轻,进而中和其效果。该防御机制在多个模型和数据集上验证,证明其在对抗性贴片攻击中的有效性,显著提高了准确性。
- 简化模型泛化中的可解释性错觉
通过使用简化模型表示来研究深度学习系统的常见方法存在假设,即简化表示的结果忠实于原始模型。然而,该研究发现即使简化表示在训练集上可以准确近似全模型,它们也可能在分布之外无法准确捕获模型的行为,这导致了理解上的幻觉。通过使用控制数据集和模型简 - 关于医学图像分析的通用视觉基础模型:基于 DINOv2 的放射学基准实验研究
本研究全面评估了基于自学习的 DINOv2 模型在放射学领域的应用,通过超过 100 个实验在不同模态下进行疾病分类和器官分割等任务,发现 DINOv2 在分割任务中表现优越,在疾病分类中具有竞争力的结果。这些发现为优化医学影像的预训练策略 - 1-Lipschitz 神经网络基于 N - 激活的表达更加丰富
通过研究激活函数的角色,论文揭示了常用的激活函数以及两段式分段线性函数在表达函数时的局限性,并介绍了一种新的 N - 激活函数,证明其比目前流行的激活函数更具表达能力。
- 使用一般替代模型对样本选择进行抵抗标签噪声
利用视觉 - 语言替代模型 CLIP 自动过滤噪声样本,并设计了一种适应性边界损失来规范由 CLIP 引入的选择偏差,从而提供对标签噪声的鲁棒性。在真实和合成噪声数据集上验证了我们提出的方法的有效性。
- 规则化对比预训练用于少样本 生物声音检测
通过提供开源代码,本研究旨在降低少样本生物声事件检测的门槛,通过提出一个简单而有效的框架来实现此任务,并通过规范化监督对比预训练来学习能够在新目标任务中进行良好迁移的特征,从而在无特征适应时取得 61.52%(0.48)的高 F 分数,在进 - RecycleNet: 潜在特征回收导致迭代决策的优化
通过 RecycleNet 方法,我们给神经网络注入反思能力,使其能够通过多次循环反馈来迭代改善初始决策,在医学图像分割任务中表现出更高的性能。
- MMPatchBackdoor:无需修改模型的深度神经网络背门攻击
在安全关键场景下,研究表明背门攻击可以在不修改神经网络模型的情况下实现,方法是在相机前放置一个精心设计的补丁(即背门补丁),它可以在大部分时间表现正常,并在输入图像包含攻击者控制的触发对象时产生错误预测。
- 基于图的多音轨音乐生成
该论文在音乐生成的深度学习系统中引入了一种新颖的图表示方法和深度变分自编码器,将音乐的结构和内容分开生成,实现了更具层次结构的人机交互音乐创作方式。
- 人类中心的可解释人工智能(XAI)的未来不在于事后解释
该论文呼吁从事人类中心的可解释人工智能研究,探究人类对于深度学习系统的理解和信任的关键作用,并提出设计可解释的神经网络体系结构的方案,以实现实时、准确、可操作、易于解释和一致的需求。
- 基于 GAN 反演的线性收敛算法用于逆向工程欺骗行为
本文提出了一种基于 GAN 和稀疏恢复的欺骗反向工程框架,为此提供了确定性线性收敛保证,并在多个非线性数据集上展示了该方法的优点。
- 评估物理世界的视觉自然性对抗攻击的基准
本研究提出了一种新的可行的攻击方式 —— 物理世界对抗攻击,该攻击可通过生成显眼和恶意构建的真实世界物品来欺骗深度学习系统。为了解决当前评估攻击自然性的方法中存在的误差、偏差和不一致性问题,我们提出了第一个用于估计物理攻击自然性的数据集,并 - 关于学习结构化表示的泛化
本文旨在研究用结构性表示学习的方法,具体分为解缠结表示与面向对象表示两个方向,以实现从非结构化数据中提取潜在结构信息的目的,同时还探讨了该方法对预训练表示和下游任务泛化能力的提升以及其对于大规模数据的高效表征学习的应用。
- 通过视觉关系提升对抗性贴片的跨任务可转移性
本文提出了一种名为 VRAP 的新型视觉关系型跨任务对抗补丁生成方法,通过场景图将基于对象识别的欺骗与基于谓词关系的排除相结合,从而破坏推理任务间共享的视觉推理信息,证明了 VRAP 在跨不同视觉推理任务的黑盒传递中具有显着优势。
- 探究物体识别性能跨收入层和地理区域降低的原因
本研究通过标注 Dollar Street 图像中的因素,例如颜色、形状和背景,揭示了不同地区、不同收入水平中目标对象之间的差异,证明性能差异是与贴图、遮挡和低照度图像的差异相关联,为提高深度学习系统的性能差异提供了解决思路。
- 频域后门攻击
该论文提出一种新的深度学习后门攻击方法 FTROJAN,通过在频域上 Trojan 攻击可以使污染图像几乎无法被检测,且攻击能够成功且不会降低模型的预测准确率。