- 自监督并非魔法:理解图像异常检测中的数据增强
本文通过对三种不同模型以及 420 种不同任务的广泛实验,认真研究了数据增强在异常检测中的作用,得出自监督作为另一个模型超参数,需要根据真实异常特征仔细选择数据增强方式的结论,并且在缺乏对应的情况下,自监督甚至会降低准确性,从而为未来的研究 - 面向自动驾驶的图像三维物体检测综述
本文综述了自 2015 年至 2021 年期间针对基于图像的三维物体检测问题的 200 多个研究,并提出了两个新的分类体系来组织现有的最先进的方法,并深入分析了它们的各个组成部分。同时,本文探讨了这个领域的挑战和未来方向。
- MMDexRay: 基于字节码图像表示的 Android 恶意软件检测的简单而有效的深度学习方法
本文提出了一种基于图像的 Android 恶意软件检测方法 —— DexRay,该方法将 DEX 文件的字节码转换为灰度向量图,并将其馈送到一维卷积神经网络模型中,对比 158k 个 app,实现了高检测率(F1-score=0.96),并 - MMAdaCrowd:无标签场景适应用于人群计数
提出了一种无标签场景自适应人群计数方法 AdaCrowd,通过使用目标场景的一张或多张无标签图像进行自适应,以更好地适应不同场景的实际应用。
- 利用伪 3D 注视增强基于图像的相互注视检测
本文介绍一种用于改进图像互相注视检测性能的简单有效的方法:在训练期间使用辅助的 3D 凝视估计任务,并通过共享头部图像编码器来实现更好的特征学习,实验证明此方法显著提高了检测性能。
- MM基于图像位置网络的零样本多视角室内定位
本研究提出了一种新的基于神经网络的架构,在无基础设施的情况下,利用多视角图像进行室内定位,同时还通过零样本室内定位设置来拓展模型的应用范围。通过与现有方法进行比较,验证了该模型的高精度和良好的应用前景。
- FSNet: 基于身份认知的图像人脸交换生成模型
本文介绍了一种基于深度生成模型的图像人脸交换技术,使用神经网络代替面部纹理,应用于只需提供两张面部图像的交换中,能够更好地处理不同面孔朝向和光照条件的情况,并在多个实验中证明了该方法优于现有方法。
- ECCV基于图像的虚拟试穿网络的特征保留模型
本文提出了一种基于图像的虚拟试衣系统,使用全新的几何匹配模块进行形变和修补,在保留衣物特征的同时,同时处理衣物和图像之间的边界问题和计算拟合度,实现了真实感和模拟性能的完美融合。
- KDD零样本人体动作识别的替代语义表示
探索了零样本人类动作识别的两种替代语义表示 —— 人类动作的文本描述和从与人类动作相关的静止图像中提取的深度特征,结果表明我们提出的基于文本和图像的语义表示显著优于传统属性和向量模型,特别是图像语义表示,即使每个类别只是从少量图像中提取的。
- 人物再识别:过去、现在和未来
这篇文章介绍了人员再识别技术及其发展历史,对手工算法和深度学习算法在画面和视频再识别任务中的表现进行了概述,描述了未来方向和需要提高的问题。