- ICML改进数据集简化中的伪相关性
调研发现,数据集压缩过程中原始数据集中的颜色和背景偏差会被放大,而污染偏差会被抑制;为减少偏差放大,我们提出了一种基于样本重新加权方案的简单但高效方法,实证结果显示其有效性高于最先进的去偏方法。
- 使用核密度估计确定机器学习模型的领域:在材料性能预测中的应用
我们发展了一种新方法来评估模型的领域适用性,并展示了我们的方法在多个模型类型和材料性质数据集中提供准确和有意义的领域划分。我们的方法通过使用核密度估计计算特征空间中测试数据点与训练数据点的距离,并展示该距离为确定领域提供了有效的工具。我们展 - 广义的柯西 - 施瓦茨散度及其深度学习应用
该研究介绍了一种用于多个分布的新型差异度量方法,名为广义柯西 - 施瓦茨差异度量(GCSD),并提供了基于核密度估计的闭合样本估计方法,方便在各种机器学习应用中使用。实验结果展示了 GCSD 在深度学习聚类和多源域适应问题上的出色性能,突显 - CVPR为低光图像增强提供可微分的空间熵的扩散模型装备
提出了一种基于统计的熵损失方法,通过引入空间熵,强调对分布而非个别像素值的学习,利用核密度估计以使得熵可微分,并在实验证明了其在低光增强方面的有效性。
- 少即通用:一种面向大型语言模型的通用且简单的非参数剪枝算法
基于核密度估计 (KDE) 的 KEN 是一种简单、通用且非结构化的修剪算法,旨在通过有选择性地保留最重要的参数并恢复其他参数到其预训练状态来构建优化的 Transformer 模型,这种方法在保持模型性能的同时只存储优化的子网络,从而实现 - 稳健的多模态密度估计
ROME (RObust Multi-modal density Estimator) 是一种非参数密度估计方法,通过聚类将多模态样本分成多个单模态样本,并将得到的单独聚类的简单核密度估计结合在一起,以估计多模态、非正态和高相关性分布。与其 - 多类定量的核密度估计
我们在本文中提出了一种基于核密度估计的多元密度表示机制,称为 KDEy,通过实验证明 KDEy 在量化性能上优于现有的分布匹配方法,并与目前在量化领域中的最强竞争者期望最大化方法展开比较。
- 密度下降用于多样性优化
多样性优化研究中,使用密度下降搜索(DDS)算法通过连续密度估计的特征空间梯度下降进行特征空间的探索,并通过核密度估计(KDE)和连续标准化流(CNF)两种密度估计方法,在多个标准多样性优化基准测试中优于 Novelty Search(NS - AAAI通过核密度估计的未知连续上下文分布的随机贝叶斯优化
使用贝叶斯优化方法,利用核密度估计来在线学习连续环境变量的概率密度函数,提出了两个算法来优化函数在未知分布下的期望,实验证明这两个算法的效果有效。
- 超越分类:目标检测中校准的定义与基于密度的估计
该研究论文探讨了在深度神经网络中定义和估计检测校准误差的挑战,并提出了一种一致且可微的检测校准误差估计器,利用核密度估计,实验证明该估计器在保持相似检测性能的同时,对竞争的训练时和事后校准方法更为有效。
- 核密度比的变分加权
多维变分法引用工具,为减小标准核密度估计的偏差而推导出最优权重函数,从而改善预测后验概率和信息论度量的估计结果,并揭示了核密度估计的一些基本方面,尤其是作为主要构建模块的算法的视角。
- 使用核密度估计方法快速逼近相似图
提出了一种基于核密度估计问题的算法框架,用于构造稀疏近似的全连接相似度图,从而保留其聚类结构,与 scikit-learn 库和 FAISS 库的实现相比,在多个数据集上显著提升了性能。
- 使用退出一个样本最大对数似然目标稳定训练概率模型
基于数据驱动方法的概率建模用于电力系统运行和规划过程,需要充足的大型数据集。本文提出一种自适应的核密度估计模型,通过分配可学习的权重给核心实现了该模型的性能改进,同时使用修正的期望最大化算法加快优化速度,并通过和高斯混合模型的比较,表明所提 - 可微的算术分布模块实现的仿射变换不变的图像分类
本研究通过结合分布学习技术设计了一个更稳健的模块,重点关注图像像素的空间分布信息,以解决卷积神经网络在旋转、平移、翻转和混洗等仿射变换下容易受到影响的问题。通过采用核密度估计构建可微分的直方图,提出了一种新颖的可微分算术分布模块 (DADM - 连续状态环境中的条件核模仿学习
我们提出了一种基于马尔科夫平衡方程和条件核密度估计的模仿学习框架,通过估计环境的转移动力学和满足环境的概率平衡方程来解决连续状态空间环境中的模仿学习问题,并在连续状态基准环境的一系列数值实验中展示了优于许多最先进的模仿学习算法的实证表现。
- 通过蒙特卡洛边缘化学习分布
提出一种从样本中学习难以处理的分布的新方法,通过最小化 KL 散度使用参数分布模型(如高斯混合模型)来近似不可解的分布。通过引入 Monte-Carlo 边缘化和 Kernel 密度估计来解决计算复杂性和非可导优化过程的挑战,该方法能够学习 - MVMR-FS:基于最大类间差异和最小冗余的非参数特征选择算法
基于最大类间差异和最小冗余的非参数特征选择算法 (MVMR-FS),通过引入监督和无监督的核密度估计,利用概率分布反映特征相关性和冗余性,在十种最先进方法中取得最高平均准确率,并提高 5% 至 11% 的准确率。
- 隐式归一化显式正则化密度估计
我们提出了一种基于正则化密度的 Sobolev 范数的非参数密度估计的新方法,该方法与核密度估计不同,使模型的偏差清晰且可解释,虽然没有与其关联的核的封闭解析形式,但我们展示了可以使用采样来近似它,所需确定密度的优化问题是非凸的,并且标准梯 - SMURF: 3D 物体探测的空间多重表示融合与 4D 成像雷达
4D 毫米波雷达是一种非常有前景的车辆感知技术,本文引入了空间多表征融合(SMURF)方法,通过使用单一的 4D 成像雷达,利用多种雷达检测点的表征,包括基于柱化和密度特征的多维高斯混合分布和核密度估计,来实现 3D 目标检测,具有较好的性 - ICML局部敏感量化快速私有核密度估计
研究了不同隐私保护机制,包括局部敏感量化的构造、带核的密度估计和增强隐私工具等,实现了快速,准确和隐私保护的数据操作。