使用卷积神经网络进行非监督学习,提取图像中的高级特征,并取得了针对 20,000 个物体类别的显著优化结果。
Dec, 2011
通过利用自动编码器将面部图像向量转化为新的表示,本研究提出一种缩小有标签训练数据差距的方法,从而在无监督的人脸验证技术方面取得了 56%的 EER 相对改进,成功缩小了余弦和 PLDA 评分系统之间的性能差距。
Dec, 2023
本文介绍了一种非监督框架来提取视频表征的语义丰富特征,并提出了一个深度卷积神经网络来分离运动、前景和背景信息。实验结果表明,该网络可以在视频中成功分割前景和背景,并基于分离的运动特征更新前景外观。此处提供的预训练方法可以优于随机初始化和自动编码器预训练,促进了区分性分类任务。
Jul, 2017
本文提出了一种无监督学习 CNNs 的方法,通过从视频帧中提取面孔对来获得受监督的训练数据并获得比手工制作特征和最先进的深度网络更高的低分辨率验证准确性,表明开发适用于姿势和光线变化的人脸验证模型是可行的。
Mar, 2018
本文提出了一种基于 CNN 和度量学习的两阶段方法,以实现面部验证和识别。实验表明,该方法优于其他最先进的方法,获得 99.77% 的成对验证准确度,并在其他两个更实用的协议下获得更好的准确度。本文也讨论了数据大小和补丁数量的重要性,展示了通往实际高性能面部识别系统的明确途径。
Jun, 2015
该论文提出了一种无监督视觉跟踪方法,使用 CNN 模型和监督学习相反,采用大规模未标记视频进行无监督训练,采用多帧验证方法和成本敏感损失来促进无监督学习,取得了与完全监督追踪器相当的基准精度,同时展示了利用未标记或弱标记数据进一步提高跟踪精度的潜力。
Apr, 2019
本篇研究提出了在视频中进行情感识别的 3D 卷积神经网络方法,使用 3D Inception-ResNet 层及 LSTM 单元,从面部图像中提取空间关系和不同帧之间的时间关系,并利用面部关键点作为输入,该方法在四个公开数据库上的表现超过了现有最先进技术。
May, 2017
本文提出了一种基于深度自动编码器模型和注意力层的关键帧检测方法,该方法首先使用自动编码器的编码器部分从视频帧中提取特征,并使用 K-means 聚类算法对这些特征和相似帧进行分割,然后从每个簇中选择与簇中心最接近的帧作为关键帧,该方法在 TVSUM 视频数据集上达到了 0.77 的分类准确率,对于视频分析领域中的关键帧提取具有良好的应用前景。
Jun, 2023
本文介绍了一种使用无标签数据训练卷积网络的方法,该方法可用于通用特征学习,通过应用多种变换来区分一组代理类别,获得了比监督学习更具鲁棒性的特征表示,能在几个流行数据集上取得胜于现有结果的分类效果。
Jun, 2014
本文提出了一种基于无监督分割的异常检测方法,使用多尺度区域特征生成器从预训练的深度卷积网络中生成描述子区域的特征,借助这些特征设计一个深度自编码器并通过快速特征重建对图像中的异常区域进行检测,该方法在多个基准数据集上取得了最新技术进展,并具有实际应用潜力。
Dec, 2020