- 从多个文档中挖掘共性和特异性用于多文档摘要
本文提出了一种基于文档层次聚类的多文档自动摘要方法,通过提取反映所有文档共性和部分子类特异性的句子生成摘要,从而满足多文档摘要的覆盖和多样性要求。在 DUC'2002-2004 和 Multi-News 数据集上的实验证明了该方法的有效性。
- AAAIMHCCL: 遮盖分层聚类对比学习用于多变量时间序列
本文提出了一种基于遮盖的分层聚类对比学习模型(MHCCL),该模型利用多个潜在分区的分层结构中获得的语义信息用于多元时间序列的表示学习,通过新颖的向下遮罩策略过滤假负面、补充正面,进一步结合了聚类层次结构的多粒度信息,设计了新颖的向上遮罩策 - EMNLP关于微调自然语言处理模型中潜空间的转换
本研究通过无监督方法分析表示空间中的潜在概念,并考察了预训练模型和微调后模型间的相似性。结论显示:较高层次的潜在空间向任务特定概念演变,而较低层次则保留了预训练模型获得的通用概念;某些概念向输出类别具有极性,并可用于生成对抗性触发器。
- 利用层次聚类和互信息最大化进行词义归纳
本文提出了一种基于分层聚类和不变信息聚类的新型无监督方法,用于解决自然语言处理中的词义识别问题,该方法可以在某些情况下优于目前提出的任何方法,并在其他情况下表现出竞争力。
- 利用神经网络探索代码风格转换
本研究利用 Python 编程语言作为样本,定义了编程代码的风格属性,并探讨了预训练代码语言模型对代码风格的识别能力。我们使用了分层聚类的方法来获取代码风格的定义,通过微调预训练模型,我们还评估了其在代码风格转换中的性能表现。
- 通过社交媒体的词汇分析绘制美国文化区域地图
本文提出一种基于自动分析社交媒体上大规模数据集的方法,以推断出文化地区,并发现了在美国社交媒体中明显的文化地区和定义它们的讨论主题。
- KDDHyperAid: 超几何空间中用于树拟合和分层聚类的去噪
该论文提出了一种基于超 bolic 空间的新方法(HyperAid),用于将 tree-metrics 适应到噪声数据,并通过引入边权重来提高适应性,该方法在边缘增强树和最短距离计量表示的合成数据,以及 Zoo,Iris,Glass,分割和 - AAAI基于表示学习和基于组的训练的无监督驾驶行为分析
本文使用多层 seq-2-seq 自动编码器以及分层聚类来进行精确的驾驶模式分析,得出特定训练数据集的可靠分类器。研究表明,该方法显著优于基准性能。
- IJCAI对比多视角双曲分层聚类
本论文提出了一种基于神经网络的模型(Contrastive Multi-view Hyperbolic Hierarchical Clustering, CMHHC),应用于多视角数据的超几何层次聚类,通过对多个视角的样本级表示进行对比来捕 - 投影:混合倡议式研究过程
本文介绍了混合式交互界面 Projection,它通过支持搜索过程中上下文添加、多维信息可视化和层次聚类等技术提高了人机交流的带宽,具有潜在的市场应用前景。
- AAAI多生成器 GAN 的自上而下深度聚类
本文提出了一种基于 GAN 的多生成器聚类方法 HC-MGAN,将其设计为自顶向下的分层聚类树,并在多个数据集上进行实验验证,发现该方法能够实现语义上有意义的聚类。
- ICCV通过标签传播扩展实例注释规模
提出了一种高效的注释方案,利用层次聚类对分割模型预测的掩模进行快速分组,从而减少手动注释的数量,实现了高效、准确的多目标分割注释。
- CVPR基于时间加权的层次聚类法用于非监督行动轮廓分割
提出一种全自动且无监督的方法,使用有效的时间加权层次聚类算法,对视频进行行动划分并在五个具有挑战性的动作分割数据集上展示出明显的性能改善。
- IJCAI使用自编码紧凑表示的分层聚类进行时间序列分析
使用 Auto Encoded Compact Sequence 和分层聚类方法构建的时间序列聚类算法,在选择最佳距离测量方法的基础上,采用递归神经网络进行自动编码,不仅可以解决大量计算时间的问题,而且在多个应用领域中表现出比基准结果更好的 - AAAI使用分层聚类和分裂神经网络实现对缺失特征的鲁棒性
本文提出了一种简单而有效的方法,使用层次聚类将相似的输入特征聚类在一起,并使用联合损失训练比例分割神经网络,从而解决机器学习和统计数据分析中缺失数据的问题。作者在基准数据集上进行了评估,展示了即使使用简单插补技术也可以取得有希望的改进,这得 - KDD可扩展的分层凝聚聚类
本文提出了一种可扩展的聚合层次聚类方法,可以在不降低质量的前提下对数十亿个数据点进行聚类,并在公开的聚类基准测试集上实现了最先进的结果,同时还将层次聚类引入作为非参数聚类目标的近似算法。
- PinnerSage: Pinterest 多模态用户嵌入式框架推荐
本文介绍了一种名为 PinnerSage 的个性化推荐系统,其中通过聚类用户的行为并对其进行代表性汇总,使用多模态嵌入为每个用户表示提供了丰富的表示,从而提供了高质量的个性化建议。作者通过离线和在线 A/B 实验表明,与单个 embeddi - 公平的分层聚类
本文研究在传统的分类中引入公正性准则,探索公平的分层聚类算法以解决机器学习系统中的过度表达问题。我们为多种自然目标提供了简单高效的算法,能够找到一个合理的公正的分层聚类,同时只会带来微不足道的目标损失。
- 分层聚类:0.585 收益近似
本研究考虑采用收益目标函数的双重问题,并证明了存在一种双重算法(经过半切)的近似解,得到了广义收益问题的 0.585 近似算法,从而改进了此前由一系列早期研究导致的 0.4246 近似保证。
- 利用本地更新的分层聚类来提高非独立同分布数据的联邦学习
本文提出了一种修改的联邦学习 (FL+HC) 方法,通过引入分层聚类步骤将客户端分为相似的集群,然后对这些集群进行独立并行的训练,实现在非独立同分布的数据环境下的模型训练,通过该方法可以使模型的性能、收敛速度、精度都有所提升。