- 梯度提升映射用于降维与特征提取
我们提出了一种监督降维方法 Gradient Boosting Mapping (GBMAP),其通过一层感知器定义的弱学习器的输出来定义嵌入,从而为监督学习任务提供更好的特征,使得简单线性模型能够与最先进的回归器和分类器相竞争,并能够自动 - 基于拓扑数据分析的稀疏投资组合选择
本文利用拓扑数据分析(TDA)工具,介绍了一种适用于稀疏组合投资的数据驱动聚类型股票选取策略。我们的资产选取策略利用股价运动的拓扑特征,选择一组在拓扑上相似(不同)的资产用于构建指数追踪(马科维茨)的稀疏投资组合。我们引入了新的距离度量方法 - 基于分布的轨迹聚类
本文提出了一种基于最新的隔离分布核 (IDK) 的聚类算法 TIDKC,它利用分布核对轨迹相似性进行测量和聚类,以解决传统和深度学习距离度量方法的局限性。通过在 7 个大型实际轨迹数据集上进行广泛评估,结果证实 IDK 能够更有效地捕捉轨迹 - 有向、加权图的最优运输距离:以细胞间通信网络为例的案例研究
比较最优输运的图表近期引起了相当大的关注,由于最优输运所引发的距离既提供了图表之间的合理度量,又给出了关联图表之间在输运计划方面的可解释描述;由于缺乏对称性,在通常考虑的形式中引入了挑战,因此图表的最优输运距离主要针对无向图进行了开发。在本 - Matrix Profile XXVII:一种新的长时间序列比较距离度量
介紹了 PATTERN REPRESENTATION COMPARISON IN SERIES (PRCIS),一種長時間序列的距離度量方法,可利用近期對時間序列用字典縮略的進展,展示其對多種任務和數據集的實用性。
- 保持距离:机器学习监控中的采样和距离阈值确定
本研究提出一种基于统计测试的距离度量方式,以实现对机器学习 (ML) 组件运行情况的监控,从而确保其可靠性和安全性。本研究同时提出一种实用的解决方案,并在交通标志识别和 CARLA 汽车模拟器等实例中进行了演示。
- 环境声音表示的扰动鲁棒性研究
本文中,我们将 Holistic Evaluation of Audio Representations (HEAR) 扩展到评估在通道效应 invariant 的 embedding 性能,通过注入扰动来模拟通道效应和三种距离测量,评估两 - MM使用量子设备算法计算图编辑距离
本文介绍了 QUBO 形式的 Graph Edit Distance (GED) 问题,它允许我们在量子芯片上实现两种不同的方法,即量子退火和变分量子算法,为机器学习和模式识别提供一种新颖的解决方案。
- ICML拓扑距离:一种基于拓扑的方法来评估生成对抗网络
提出了一种新的度量距离叫做拓扑距离,它可以比较真实数据和生成数据的几何和拓扑特征,同时也能够衡量生成对抗网络(GANs)的学习效果。在多种数据集上,与常用的测量方法进行了比较,证明了该方法是一种强有力的候选指标。
- ICCV应用于对抗学习和域自适应的混合分布归一化 Wasserstein 距离
本文研究通过引入归一化 Wasserstein 度量来解决不平衡混合比例问题,并将其应用于生成模型、域自适应和聚类等多个领域,表现出显著的性能提升。
- EMNLP通过子词参数重建词向量嵌入
该研究提出了在子词素水平上进行操作以从预先训练的词嵌入中受益的方法,并报告了在词相似性、词类别标注等任务上的有趣结果。
- 高效聚类大规模带属性图
提出了一种快速可扩展的算法 SToC (Semantic-Topological Clustering),用于将大规模带属性图分割为同质化的簇,并利用底部 - k 草图、传统图论概念和新的异构距离测量组合方案,快速计算高质量的划分。
- 一种基于路径的网络数据分析框架
本文介绍了一种基于路径收集的网络数据分析框架,使用基尔霍夫矩阵求解策略计算路径之间关系概率分布,并提高了一种框架的应用,可以计算并测量不同的节点关系度量标准,并通过实验证明了该方法在半监督分类问题上的竞争优势。