- 发挥轨迹片段在无监督视频人物再辨识中的潜力
本文提出了一种无监督视频人员重识别的自监督精细聚类 (SSR-C) 框架,通过减少由于嘈杂跟踪结果引起的 tracklets 特征偏差的噪声过滤模块 (NFTP),将 tracklets 划分为 “子 tracklets”,利用自监督信号进 - ICML细粒度类别及其发现方法
FALCON 是一种无监督的方法,可以从粗糙标记数据中发现细粒度类别,并且能够有效地学习并优于基线方法在图像分类任务中表现。
- CVPRUVIS: 无监督视频实例分割
UVIS 是一种无监督视频实例分割框架,利用 DINO 模型的密集形状先验和 CLIP 模型的开放识别能力,通过帧级伪标签生成、基于 Transformer 的 VIS 模型训练和基于查询的跟踪等三个关键步骤实现,通过采用双存储器设计,包括 - 医学影像系统的深度学习特征提取识别的进展
提出了一种利用空间分层技术的新型无监督医学图像特征提取方法,并提出了基于权重的目标函数以实现快速图像识别。该算法将图像的像素分为多个子域,并使用四叉树访问图像。利用单纯形算法提出了一种阈值优化技术。针对高光谱图像的非线性特征,提出了一种基于 - U-TELL:非监督式任务专家终身学习
提出了一种名为 U-TELL 的无监督连续学习(Continual learning)模型,该模型使用任务专家,通过训练生成的结构化样本进行任务分配,以解决由于有限标签信息导致的灾难性遗忘问题。
- BUDDy: 单通道盲无监督除混响实现弥散模型
该论文提出了一种基于扩散模型的无监督单声道方法,用于联合盲去混响和房间脉冲响应估计。在各个频率子带上使用带指数衰减的滤波器对混响运算符进行参数化,并沿反向扩散轨迹迭代估计相应的参数。通过测量一致性准则强化生成语音与混响测量的真实性,同时无条 - 频率引导的多级人体行为异常检测与流形规范化
介绍了一项名为人类行为异常检测(HAAD)的任务,旨在通过仅具有预先确定的正常训练动作样本类别,以无监督的方式识别异常运动。提出了一种基于归一化流(NF)的检测框架,可以有效地利用样本似然来指示异常。通过将动作样本从时域转换到频域,以减轻数 - 纹理的盲定位和异常聚类
我们提出了一种新的方法来在纹理图像中盲目聚类异常,通过高精度地识别异常区域并使用对比学习增加不同异常类型的可分离性和降低类内变异,我们的实验表明所提出的解决方案相比以往工作有了显著的改进,树立了新的技术水平。
- MambaAD:用于多类无监督异常检测的状态空间模型研究
应用 Mamba 到多类无监督异常检测,提出了包含预训练编码器和 Mamba 解码器的 MambaAD,通过在多个尺度上引入局部增强状态空间模块 (LSS),该方法在六个不同的异常检测数据集上展示了具有 SoTA 性能的结果,证实了其有效性 - 融合高光谱与激光雷达注意力的无监督波段选择与自编码器整合
该研究论文引入了一种创新的无监督波段选择框架,通过注意机制和自编码器实现基于重建的波段选择,将高光谱成像与 LiDAR 数据进行融合,以提高分类准确性和性能。
- DiffOp-net: 一种基于微分算子的全卷积网络用于无监督可变形图像配准
通过引入新的微分算子到注册框架中,以保证速度场的平滑性,结合交叉坐标注意力模块和多分辨率注册架构,改进了无监督可变形图像配准方法,在两个磁共振成像(MRI)数据集上进行了评估实验,表现出卓越的准确度、可变形性能和注册速度。
- CVPR视觉概念连接图 (VCC): 深度模型中的开放世界概念发现与它们的层间连接
理解深度网络模型在其学习到的表示中捕捉到的内容是计算机视觉中的一个基本挑战。我们提出了一种新的方法来理解这样的视觉模型,即视觉概念连接图(VCC),它以完全无监督的方式发现人类可解释的概念及其在不同层之间的连接。我们的方法同时揭示了网络结构 - 基于隔离机制的异常检测:一项调查
孤立基于方法的异常检测方法是一种新颖且有效的方法,可以通过随机分割轻松地隔离出数据中的异常值。这项综述调查了最先进的孤立基于异常检测方法,包括它们的数据分割策略、异常得分函数和算法细节。还介绍了孤立基于方法在不同场景下的一些扩展和应用,例如 - 基于矩阵分解的无监督特征选择的核对齐
通过特征选择方法,将无关和冗余特征删除,以期获得原始特征的良好表示。本文构建了一个模型,通过集成核函数和核对齐,来解决非线性结构信息的捕捉问题。此外,还提出了一种多核学习方法,通过学习线性和非线性相似性信息,并自动生成最合适的核函数。在实验 - 无监督图神经架构搜索与解耦的自我监督
通过提出一种新颖的解缠结自监督图神经结构搜索 (DSGAS) 模型,并在未标记的图数据上进行自监督训练,该模型可以以无监督的方式发现捕捉各种潜在图因素的最佳结构,并取得在一些基准方法上的最先进性能。
- VoxGenesis:无监督发现语音合成的潜在说话人流形
提出了一种无监督的语音合成框架 VoxGenesis,通过探索潜在空间,发现与特定说话者特征相关的可解释方向,实现对声音的编辑,并生成更具多样性和真实性的说话者。
- 基于集成的无监督非连续性短语结构分析方法
我们提出了一种新的集成方法来处理无监督的不连续句法分析问题,通过对现有的不连续解析器的多次运行进行平均预测,稳定并提升性能。同时,我们还提供了对于不同二进制和连续性设置下的树平均的综合计算复杂性分析,以及一种高效的精确算法来解决这个任务,实 - 基于 SAM 引导的轻量级双流模型用于异常检测
我们提出了一种以 Segment Anything(SAM)为导向的双流轻量级模型,用于无监督异常检测(STLM),在工业异常检测中取得了与最先进方法相媲美的性能,并在更困难的数据集上进一步验证了它的有效性和通用性。
- 基于网格的连续正态表示用于异常检测
本研究提出了一种新的异常检测方法 GRAD,通过将空间特征转换为坐标并映射到连续网格,成功地在 “连续” 特征空间中表示正常特征,并通过融合局部和全局正常特征来有效地处理不同类别的对象,实验证明 GRAD 在多类统一异常检测方面降低了 65 - 通过布局学习实现解耦的 3D 场景生成
我们介绍了一种通过大型预训练的文本到图像模型实现对三维场景进行解缠的方法。我们的关键观点是,通过重新排列具有空间先验的三维场景的部分,可以发现物体的存在,并且这些重排后的场景仍然是原场景的有效配置。具体而言,我们的方法从头开始联合优化多个