一类距离度量下基于 k - 近邻的数据集分类
证明了 $k$ 最近邻学习规则在每个 sigma-finite 维度空间中都是普遍一致的,同时调查了度量的相关几何性质以及 Stone 方法中的限制,通过构建各种例子来推广这一结论。
Feb, 2020
该论文提出了一种改进的 K 近邻分类器,它可以自适应地为每个查询选择 K,该选择取决于每个邻域的属性,因此可能在不同点之间显着变化,并且可以利用条件概率推导推导出一些收敛界限。
May, 2019
本研究主要探讨了在度量空间中的对象,如最近邻搜索和聚类等重要数据挖掘问题,以及在图上聚类和分类等的应用。研究发现,虽然一些流行的大规模图距离量度并非度量空间,但可以定义一类包含多种距离度量且具有可计算性和可扩展性的图距离度量方法。此外,研究人员还探讨了如何将节点的属性信息融入度量中。
Jan, 2018
本文提出了一种廉价的方法来学习有效的差异度量函数,该函数可用于 $k$- 最近邻分类。方法通过仅学习标记对象的变换来提高分类准确性,同时保持查询对象在原始坐标系中不变。通过解决标准岭回归问题,可以有效地学习变换,且速度比现有方法快两个数量级以上。此外,该方法消除了优化 “负” 对象对的开销,并具有减少数据中心极性的理论基础。
Jun, 2018
本文介绍了一种基于稀疏先验的 PAC-Bayesian 限制方法,将 K 最近邻分类器转化为核空间框架以求得其广义误差的界限,并在实验中证明了其高效性。
Sep, 2021
通过简单修改最近邻分类器,我们展示了一个强 Bayes 一致的学习器,优于 k-NN 分类器,并在限制样本大小和算法时间方面具有较大的优势,获得了令人鼓舞的实验结果。
Jul, 2014
本文介绍了最近邻分类器的技术和方法,主要关注评估相似度、处理计算问题、降低数据维度等方面,新增时间序列相似性、检索加速和固有维度的相关内容,并提供了相关 Python 代码。
Apr, 2020
本研究提出了一种新的 KNN 算法,通过测试和比较,在理论场景和基于离子迁移谱指纹的室内定位方面均取得了比标准 KNN 更高的分类准确度,同时要求相同的计算需求。
Apr, 2023
本研究针对深度学习在对抗性环境下的鲁棒性和预测不可解释性等问题,通过将 k-NN 算法与深度学习结合,提出了一种名为 DkNN 的混合分类器,它可以为输入数据提供信心估计和人类可解释的预测解释。实验证明,DkNN 算法可以准确识别模型外部的输入,同时提供直观和有用的模型失败解释。
Mar, 2018
研究使用局部 -$k$- 最近邻分类器的全局超额风险的渐近展开式,通过此理论发现半监督学习问题中的局部选择 $k$ 能够实现额外风险的收敛速率,同时通过模拟研究验证了该理论。
Apr, 2017