一类距离度量下基于 k - 近邻的数据集分类

Nov, 2015

一类距离度量下基于 k - 近邻的数据集分类

k-Nearest Neighbour Classification of Datasets with a Family of Distances

Stan Hatko

TL;DR本论文研究使用替代距离的最近邻分类器（k-NN）算法，并探讨了基于一系列随机范数或基于一些特定的一致性条件的距离，并探究了对类别标签的自适应选择距离的两阶段 k-NN 分类器。

Abstract

The $k$-nearest neighbour ($k$-NN) classifier is one of the oldest and most important supervised learning algorithms for classifying datasets. Traditionally the Euclidean norm is used as the distance for the $k$-NN classifier. In this thesis we investigate the use of alternative distances

k-nearest neighbour classifier alternative distances stone's theorem universal consistency uniformly locally lipschitz functions

发现论文，激发创造

度量空间中 k-NN 规则的普适一致性和 Nagata 维度

证明了 $k$ 最近邻学习规则在每个 sigma-finite 维度空间中都是普遍一致的，同时调查了度量的相关几何性质以及 Stone 方法中的限制，通过构建各种例子来推广这一结论。

Feb, 2020

分类的自适应最近邻规则

该论文提出了一种改进的 K 近邻分类器，它可以自适应地为每个查询选择 K，该选择取决于每个邻域的属性，因此可能在不同点之间显着变化，并且可以利用条件概率推导推导出一些收敛界限。

May, 2019

一个可简易处理的图距离家族

本研究主要探讨了在度量空间中的对象，如最近邻搜索和聚类等重要数据挖掘问题，以及在图上聚类和分类等的应用。研究发现，虽然一些流行的大规模图距离量度并非度量空间，但可以定义一类包含多种距离度量且具有可计算性和可扩展性的图距离度量方法。此外，研究人员还探讨了如何将节点的属性信息融入度量中。

Jan, 2018

一种使用非负样本的 k-NN 分类快速易懂的回归技术

本文提出了一种廉价的方法来学习有效的差异度量函数，该函数可用于 $k$- 最近邻分类。方法通过仅学习标记对象的变换来提高分类准确性，同时保持查询对象在原始坐标系中不变。通过解决标准岭回归问题，可以有效地学习变换，且速度比现有方法快两个数量级以上。此外，该方法消除了优化 “负” 对象对的开销，并具有减少数据中心极性的理论基础。

Jun, 2018

基于距离的分类器的 PAC-Bayesian 分析：最近邻为什么有效！

本文介绍了一种基于稀疏先验的 PAC-Bayesian 限制方法，将 K 最近邻分类器转化为核空间框架以求得其广义误差的界限，并在实验中证明了其高效性。

Sep, 2021

一个贝叶斯一致的 1-NN 分类器

通过简单修改最近邻分类器，我们展示了一个强 Bayes 一致的学习器，优于 k-NN 分类器，并在限制样本大小和算法时间方面具有较大的优势，获得了令人鼓舞的实验结果。

Jul, 2014

k - 最近邻分类器：第 2 版（附带 Python 示例）

本文介绍了最近邻分类器的技术和方法，主要关注评估相似度、处理计算问题、降低数据维度等方面，新增时间序列相似性、检索加速和固有维度的相关内容，并提供了相关 Python 代码。

Apr, 2020

基于灵活 K 近邻分类器的导出和应用：针对基于离子迁移谱的室内定位

本研究提出了一种新的 KNN 算法，通过测试和比较，在理论场景和基于离子迁移谱指纹的室内定位方面均取得了比标准 KNN 更高的分类准确度，同时要求相同的计算需求。

Apr, 2023

深度 k 近邻：朝着自信、可解释和鲁棒的深度学习发展

本研究针对深度学习在对抗性环境下的鲁棒性和预测不可解释性等问题，通过将 k-NN 算法与深度学习结合，提出了一种名为 DkNN 的混合分类器，它可以为输入数据提供信心估计和人类可解释的预测解释。实验证明，DkNN 算法可以准确识别模型外部的输入，同时提供直观和有用的模型失败解释。

Mar, 2018

局部近邻分类及其在半监督学习中的应用

研究使用局部 -$k$- 最近邻分类器的全局超额风险的渐近展开式，通过此理论发现半监督学习问题中的局部选择 $k$ 能够实现额外风险的收敛速率，同时通过模拟研究验证了该理论。

Apr, 2017