关键词distance-based methods
搜索结果 - 8
- 基于最优输运的条件分布熵检测异常样本
通过建立优化方程,利用训练样本和测试输入的几何信息,提出了一种无需依赖分布假设、先验知识和特定训练机制的新型距离方法,用于在存在测试输入的情况下,有效利用分布信息来判断样本是否为来自分布之外的样本,并在基准数据集上展开的大量实验证明了该方法 - AAAI如何解决超出分布检测的维度诅咒?
机器学习模型在野外部署时可能会受到未知类别的离群数据的挑战。最近对 OOD 检测的进展依赖于距离度量,以区分相对于内部分布数据而言相对较远的样本。尽管有前景,但基于距离的方法可能受到维度灾难问题的困扰,从而限制了在高维特征空间中的功效。为解 - 基于袋装正则化的 $k$- 距离异常检测
我们提出了一种新的基于距离的算法 BRDAD,将无监督异常检测问题转化为凸优化问题,并通过减小风险来解决距离算法中超参数选择的敏感性挑战。此外,我们的算法还采用包法来提高处理大规模数据集的效率,理论上证明了算法的快速收敛性,并通过实验证明了 - EMNLP全面的句子嵌入提升 ODS 检测效果
通过提出更全面的平均句子嵌入方法 Avg-Avg,将来自每个中间层的所有令牌表示平均为句子嵌入,为 fine-tuned 预训练语言模型中的 out-of-distribution 检测提供了免费的提升,并在一系列基准测试中超过了现有的最先 - ICML深度最近邻实现的超范围检测
本文研究使用非参数最近邻距离方法进行开放世界中一类重要任务:Out-of-distribution 检测,不同于先前的研究,该方法不施加任何分布假设,因此具有更强的灵活性和普适性,在多个基准测试中证明了其有效性,并且相对强基线的 Mahal - InterHT: 头尾实体交互的知识图谱嵌入
本文探讨知识图谱嵌入模型中基于距离的方法,在实验结果中展示了两种新颖的方法(InterHT 和 InterHT+),和对比实验结果表明我们的方法在 ogbl-wikikg2 数据集上获得了最佳结果。
- 基于随机投影和距离协方差的统计和数值高效独立检验
使用随机投影和距离相关性基础上的独立性测试方法 RPDC,其计算复杂度为 O (nKlogn),在多元情况下表现良好,并具有与最先进的距离方法近乎相同的功率。
- 语言树的准确性
通过 Ethnologue 专家分类的比较,对使用全球语言数据库进行语系重构的距离方法进行了全面调查和准确性评估,并量化了数据库的完整性和覆盖范围对重构准确性的影响。