- 通过对比学习和无监督聚类重新思考图像伪造检测
图像伪造检测的新方法 FOrensic ContrAstive cLustering (FOCAL) 基于对比学习和无监督聚类,通过像素级对比学习指导高级取证特征提取,使用实时无监督聚类算法将学习到的特征聚类为伪造 / 原始类别,并通过特征 - 构建 RadiologyNET:大规模多模态医学数据库的无监督注释
通过多模态数据源自动标注医学放射照片,利用机器学习技术进行医学诊断和治疗的自动化流程。
- 在活性粒子系统中学习局部主导力平衡
利用无监督聚类和稀疏度推导算法的组合,学习解释自组织活性粒子系统中的宏观模式形成的局部主导力平衡,揭示了该系统中的自组织结构形成的物理机制。
- ICML神经元实际上被折叠了吗?神经表示中的细粒度结构
研究发现,在训练良好的神经网络中观察到神经坍塌现象,并提出即使当看起来的神经表示坍塌时,微小的剩余变化仍然可以忠实准确地捕捉输入分布的内在结构。
- 循环神经网络隐藏状态向量和语义实体关系的研究
研究表明,循环神经网络的隐藏状态向量往往会形成语义相似向量的聚类,即聚类假设;本文利用现代神经网络架构中训练出的循环神经网络,在识别正则语言的过程中,研究了聚类假设。实验结果支持聚类假设的有效性。
- 基于目标导向的可解释聚类方法:语言描述
本文提出了一种名为 GoalEx 的目标驱动聚类框架,结合用户目标和自由形式的语言描述,采用语言模型和整数线性规划等方法实现对大型语料库的层次化聚类,并在辩论、客户投诉和模型错误等方面进行了应用。
- 深度时空聚类:一种针对多维气候数据的时间聚类方法
利用 DSC 算法,结合 CNN-RNN 模型学习数据的空间和时间特征,通过聚类和数据重构误差优化来实现高维时空数据的无监督聚类,并在气候数据上的实验结果表明,该方法的效果要优于现有的无监督聚类算法。
- 使用隐式神经表示学习具有旋转和翻译不变性的表示
该文介绍了一种使用隐式神经表示和超网络获取图像的不变语义表示的方法,该方法可以在任意或随机旋转和平移的图像中获取方向不变的语义表示,并与 SCAN 结合,获得最新的无监督聚类结果。
- 可视化聚类中的公平性:一种新型 Transformer 聚类方法
本文提出了一种新的损失函数和注意力机制,以促进聚类模型的公平性和减少人口统计学偏差,实验结果表明该方法在多个敏感属性上提高了聚类准确性和公平性。
- CVPR揭示 STEGO 的内部工作机理,以实现安全的无监督语义分割
本文研究使用自监督预训练策略和 Vision Transformer 架构的 DINO 自蒸馏技术,以无监督聚类和语义对应的方式进行通用特征提取;并介绍了基于 DINO 预训练的 Vision Transformer 的特征相应的无监督语义 - 不定概率神经网络
本文提出了一种新的概率神经网络模型 IPNN,该模型能够将神经网络和概率理论结合起来,并且在分类任务中具有无监督聚类的能力。该模型可以使用很小的神经网络对数十亿个类别进行分类。
- MM通过学习离散音素级韵律表示实现可控语音合成
本文介绍一种使用直观的离散标签实现音素级 F0 和时长控制的新方法,其使用无监督的韵律聚类过程将音素级 F0 和时长特征离散化为韵律标签的输入序列,该模型不需要参考语音就能合成语音,并具有高质量的语音输出和有效的韵律控制能力。
- 使用全局和局部引力对无限数量的发言人进行在线神经分离
本研究提出了一种新的音频说话人分离方法 --EEND-GLA, 它结合了声源吸引点和无监督聚类,能够在离线和在线推理中对未知数量的讲话人进行说话人分离,实验结果表明其分离效果良好。
- BN-HTRd: 一份用于离线孟加拉文手写文本识别(HTR)和行分割的基准数据集
该文章介绍了一个新的离线手写文本识别数据集,集中在孟加拉文字的图像上,该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。
- 吸引和分散:一种用于无源域自适应的简单方法
提出一种用于领域自适应的无源自适应方法,通过将 SFDA 视为无监督聚类问题并按照特征空间的本地邻居应具有更相似的预测这一直觉来优化预测一致性的目标,进而实现特征聚类及簇分配的高效训练,同时将已有的领域自适应方法、无源域自适应和对比学习之间 - IJCAI跨模态原型对比的无监督语音 - 脸部表征学习
本文提出了一种跨模态原型对比学习的方法,该方法通过无监督聚类在不同模式下构建语义上的正样本,并通过比较跨模态实例的相似性来动态重新校准无法学习的实例对总体损失的贡献,最终实验证明,该方法在各种语音 - 面部相关性评估协议中均优于最先进的无监 - 使用无监督聚类优化深度学习模型,预测基因突变
本研究提出了一种基于非监督聚类的多实例学习方法,将其应用于三种癌症(CRC、LUAD 和 HNSCC)的 WSI 深度学习模型开发,使其能够更好地预测基因突变。结果显示,该方法可以识别预测性图像块,排除缺乏预测信息的图像块,并改善所有三种癌 - CVPRDeepDPM: 未知聚类数的深度聚类
本文介绍了一种有效的深度聚类方法,该方法使用了分裂 / 合并框架、动态体系结构自适应于不断变化的聚簇数量 K,并且不需要预先指定 K 值。论文证明了这种无需预先指定簇数的非参数方法在 ImageNet 等数据集上,超越了现有的基于深度学习和 - 基于聚类的消极筛选法用于人类活动识别中的对比学习
该研究提出了一种新的对比学习框架 ClusterCLHAR,以应用于基于传感器数据的人类活动识别,在三个基准数据集上的实验结果表明它在自我监督学习和半监督学习中优于所有最先进的方法。
- 无需领域内标签:文本领域外检测
本研究旨在解决无法获取 in-domain 数据标签的情况下,从语言模型和表示学习的角度,通过无监督的聚类和对比学习的结合,对 OOD 检测进行更好的数据表示学习,实验证明该方法的性能显著优于基于概率的方法,并且可以与基于标签信息的监督方法