- 利用对抗验证量化地理空间机器学习预测的差异性
通过对地理空间机器学习预测结果和样本数据之间的差异度进行量化,在 0 到 100% 的区间内,基于对抗验证的方法可以准确度量差异度。此方法在合成和真实的数据集上测试,并逐渐增加差异度来研究其效果和普适性。测试结果表明该方法可以成功地量化整个 - 多核 k 均值聚类的核相关 - 不相似性
通过综合使用核相关性和差异性,我们提出了一种新的方法来提取非线性信息和实现最优聚类,从而提高聚类的性能。
- 双解离深度多聚类
本研究提出了一种名为 DDMC 的新型双解缠绕深度多聚类方法,通过学习解缠绕表示来实现多个隐藏数据结构的独立聚类目标,并通过变分期望最大化(EM)框架进行实现,实验证明 DDMC 在七个常用任务上始终优于现有的方法。
- 一种近线性时间算法的 Chamfer 距离
提出了一种使用近似算法以几乎线性的运行时间估算 Chamfer 距离的方法,适用于大规模高维数据集,为分析大规模高维点云开辟了新的途径。
- ICML探索新的方法:强调表征差异性以学习新特征并减少误差一致性
利用表征相似性领域的方法,提出了一种新颖的想法,在训练期间推动中间表示在不同架构之间的深度上不同,以学习具有不同故障模式的鲁棒集成模型。结果表明,高度不相似的中间表示导致较低的相关性输出预测及稍微降低的错误一致性,并提高了集成模型的准确性。
- 重新审视相似性和不相似性在最佳反驳论点检索中的作用
本文提出了一种基于 Bert 的新模型 Bipolar-encoder,通过相似度和不相似度度量来评分反驳论证,并通过实验证明了其比传统方法和最近的神经评分模型更加有效和高效。
- MM基于汉明距离的协同过滤比特级重要性编码
使用投影哈明距离和变分哈希模型优化哈希码,可在海明空间内进行表征,并在协同过滤实验中取得有效性增益,无需额外存储和计算负载。
- 快速 k-Medoids 聚类:改进 PAM、CLARA 和 CLARANS 算法
本文提出了 PAM 算法的修改,以达到算法第二个步骤中 O (k) 倍的加速,同时发掘了选择初始核心点的其他策略,实验证明与原始 PAM SWAP 算法相比,算法速度可提升 200 倍,适用于大型数据集和更高的 K 值。
- ECCV隐马尔可夫模型的聚合 Wasserstein 指标和状态对齐注册
本论文提出了一个名为 Aggregated Wasserstein 的框架,用于计算两个具有高斯状态条件分布的隐马尔可夫模型之间的差异度量或距离,通过匹配 GMM-HMM 中的状态来实现对其进行注册,通过求解优化问题匹配分量,通过对两个 G - 基于包的不相似性的多示例学习
本文提出了一种基于袋之间的不相似性的向量表示方法,用于多实例学习中的学习和分类,这种方法在多个 MIL 数据集上都具有与最先进算法相当的性能,计算代价较小。
- 费舍尔信息距离:几何阅读
本文采用几何方法研究 Fisher 距离(用于测量两个概率分布函数之间的差异),并在多种统计模型中应用超几何几何学推导 Fisher 距离,同时设计与 Kullback-Leibler 差异测量的关联。