图像隐私预测的动态深度多模态融合
本文研究了利用卷积神经网络和用户标签来自动预测图像的隐私,并将不同卷积神经网络中提取的深度特征进行比较,结果表明使用 ResNet 提取的特征的学习模型在图像隐私预测方面优于其他模型。同时,该研究结果还表明深度视觉特征和图像标签的组合可以提高预测性能。
Mar, 2019
本文研究并提出了一种基于深度特征和图像标签的图像隐私预测方法,结果表明该方法明显优于基于 SIFT 和 GIST 等基准线的方法以及采用 “标签袋” 作为特征的方法。
Oct, 2015
该论文采用决策级融合方法将文本和图像输入用于产品分类预测,通过训练深度神经网络和学习网络来选择输入类型,并成功地提高了大规模产品分类数据集上的准确性。
Nov, 2016
本研究提出了两种自适应融合网络(Auto-Fusion、GAN-Fusion),通过对不同模态的特征进行有效的上下文建模,在多模态机器翻译和情感识别等任务中取得了比现有方法更好的效果。
Nov, 2019
本文提出了一种在存在不完善模态的情况下设计稳健的深度多模态学习体系结构的方法 - 通过使用深度融合架构进行目标检测,并使用带有门控信息融合网络调节贡献权重进行构建,以实现具有抗干扰性的性能表现提高,对于 KITTI 数据集的单发探测器(SSD),本文通过数据增强方案和提出的融合网络取得了显著的性能提升。
Jul, 2018
利用从图像中提取的对象来确定图像为私人图像的难度比较大。通过使用特征归属来解释这些模型的决策,我们发现人类类别和其个数是决定隐私决策的主要因素。因此,这些模型在识别包含敏感数据的私人图像、车辆所有权和互联网活动的图像,以及含有人类的公共图像时通常失败。为了将来的基准测试,我们还设计了两个基于人类出现和数量的策略,并实现了与隐私模型相当的分类性能。
May, 2024
本文提出了在监督医学图像分析中进行图像融合方案的概念架构,实现了基于卷积神经网络的三种图像融合方案,并将其结合成单个框架,用于同时分析多模式图像,检测软组织肉瘤的存在,并发现在特征级别融合的情况下,性能最好,但当任何图像模式存在大误差时,其鲁棒性会降低。
Oct, 2017
哺乳动物的大脑通过整合特定感官模式的脑区的信息来处理复杂推理,从而提高鲁棒性和泛化能力。我们开发了一个融合模型,结合了在 Imagenet 和 Places365 上训练的 CNN 的背景和前景特征,测试了它对人可感知变化的抵抗能力,并在 MS COCO 上进行了验证。融合模型提高了鲁棒性,特别适用于具有更大上下文变异性的类别。我们提出的多模态整合解决方案为增强鲁棒性提供了一种新方法,并可能与现有方法相辅相成。
Jun, 2024
本研究提出了一种新颖的基于深度学习的多模态数据融合框架,具有异构维度(例如 3D+2D)的兼容定位任务的能力,并在地理萎缩和视网膜血管分割任务上取得了优于现有单模态方法的结果。
Feb, 2024
通过将上下文二进制信息转化为概率图,并提出一种早期融合结构,在 DOTA 数据集上进行了广泛实验证实,本文研究了仅有一种模态包含目标物体且其他模态提供关键上下文信息的多模式目标检测中的对齐问题。
May, 2024