- 基于分层狄利克雷过程的分布鲁棒优化中的力量借助
该论文介绍了一种新颖的优化框架,用于解决现代机器学习应用中的关键挑战:高维度、分布不确定性和数据异质性。该方法通过使用分层狄利克雷过程(HDP)先验,有效处理多源数据,实现正则化、分布鲁棒性,并在不同但相关的数据生成过程之间共享强度。通过建 - 二进制数据的内在维度是多少?- 如何快速计算
使用基于概念的内部维度对数据集进行分析和理解的研究,提出了一种基于计算概念的近似方法,通过计算某个支持值来评估内部维度,并使用 Tatti 等人的多个数据集进行验证。
- 深度聚类评估:如何验证内部聚类验证指标
利用深度神经网络对复杂、高维数据进行分区的深度聚类方法存在独特的评估挑战,传统的聚类验证度量方法因适用于低维空间而在深度聚类中存在问题,本文针对在深度学习中评估聚类质量的问题进行了研究,提出了一个理论框架来突出使用内部验证度量方法在原始数据 - 为所有下游代理商预测换手遗憾
通过提供非校准但在一系列事件中无偏的预测,我们可以以较快的速度保证任意下游代理的降低交换后悔,同时保持我们的预测算法在不需要了解其效用函数的情况下为任何下游代理提供保证。
- 探索维度情感语音分析中显著表示和标签变异性
通过降维预训练表示空间,这篇论文展示了如何在情感识别任务中减少模型复杂性而不降低性能,并且模拟标签不确定性以提高模型的泛化能力和鲁棒性。此外,论文比较了情感模型在声学恶化下的鲁棒性,并观察到降维表示能够保持与全维表示相似性能而不发生显著的情 - 高速异常挖掘的多维时间序列速写
提出了一种在多维时间序列中进行异常挖掘的草图方法,通过对数据进行初始预处理后,实时独立于原始数据的维度性能。该方法具有至少一个数量级(50X)的吞吐量改进,并对近似解的质量影响较小,同时还可以处理维度的动态添加或删除。
- 关于句子嵌入的维度
通过维度分析,我们提出了一种双步训练方法,优化编码器和池化器以减轻低维场景中的整体性能损失,从而显著提高低维句子嵌入的性能。
- 神经策略镜面下降在低维流形上的策略优化的样本复杂度
深度策略算法解决高维度策略优化问题取得了巨大成功,但目前的分析无法解释它们为何对维度诅咒具有抵抗能力。本研究以卷积神经网络作为函数逼近器,研究了神经策略镜像下降 (NPMD) 算法的样本复杂性。通过观察高维度环境具有低维结构的经验现象,例如 - 关于充分图模型
将非线性合适降维技术应用于条件独立性评估,引入了一种足够的图模型,该模型在本质上是非参数的,避免了高维核函数引起的维度灾难;通过模拟比较和对 DREAM 4 挑战数据集的分析,证明了该方法在高维设置下,且当高斯或 copula 高斯假设不成 - 度量空间中 $k$-NN 规则的普适一致性及长田维度. II
证明了 KNN 法在分离式度量空间中,具有强全局一致性和普遍一致性,即使在不满足 Nagata 维度为有限维的度量空间,也能得到强全局一致性。
- 利用平滑性需要多少样本?
本文通过推导一种新的泛化误差下限,研究了通常在经典学习理论陈述之外通常未描述的常数和瞬态区域在实践中起到的支配作用,并探讨了基于 Fourier 或小波展开替代 Taylor 展开所带来的影响,进一步研究了统计学习中的核心原则 - 平滑性如 - 通过跳跃扩散模型进行跨维度生成建模
我们提出了一种新的生成模型类别,通过同时建模每个数据点的状态和维度,自然地处理各种维度的数据。该生成过程被制定为在不同维度空间之间跳跃的跳跃扩散过程。我们首先定义一个破坏维度的前向噪声过程,然后导出维度创建的时序反转生成过程,以及用于学习逼 - 大型语言模型是否适合作为抽象概括的评估器?
本文旨在探讨使用 LLMS(例如 “gpt-3.5-turbo”)作为自动评估器来评估摘要的性能,并比较了不同的评估方法和提示格式对其评估能力的影响。作者建议哪些提示格式可以提高 LLM 的性能,并讨论了 LLM 的评估能力随摘要质量和评估 - 从成对相关性推断出本地结构
研究多元复杂系统的建模,利用局部结构检测与变量的成对相关性推断数据的维度和像素排列,辅助现代基于注意力机制的机器学习方法的成功实现。
- 扩展或缩小表示,控制预训练偏差轻松实现高效迁移学习技术
本文提出改变自监督学习模型中主干神经网络的最后一个块的维度,是解决预训练偏差问题的一种简单有效的方法,并可以提高自监督预训练模型和有监督预训练模型的迁移学习性能。
- 使用条件变分自编码器学习流形维度
研究证明变分自编码器和其条件扩展在多个领域可以达到最新成果,小样本图像中具有低维曼诺尔性质的特殊数据,其复杂行为仍不为人所知晓,本文从数据分布的角度出发,通过实验证明变分自编码器的全局最小值可以学习到正确的曼诺尔维度,在这个前提下讨论了更普 - ICML非参数的 Involutory Markov Chain Monte Carlo
我们提出了非参数的纠缠马尔科夫链蒙特卡罗(NP-iMCMC)算法,作为一种构建用于普通概率编程语言(PPL)可表示的非参数模型的 MCMC 推理算法的方法。该方法建立在统一的纠缠 MCMC 框架之上,并通过提供一个在维度之间驱动状态移动的一 - 从蒙特卡洛到神经网络的边界值问题近似
本文研究用概率方法和神经网络逼近求解 Poisson 方程,并提出基于球面游走算法轻微改变的蒙特卡洛数值近似方法,其维数无需指定且具有高效性和多项式复杂度。同时,本文证明使用该数值近似方法得出的随机深度神经网络可在多项式时间内对 Poiss - ICML一种具有几乎不依赖维度的全局黑盒优化方法及其收敛速率保证
本文提出了一种基于对偶探索方法的普适梯度优化算法 UnderGrad,可以在无需先验知识的情况下,对包括具有适应性 Lipschitz 光滑性和随机梯度代价的问题进行高效求解。
- ICLR学习的 W 玻色子表征的探索
本文提出基于变分自编码器模型的碰撞物理学数据训练方法,使用地球移动距离的近似值作为输入和输出喷注的重构误差指标。得到的模型学习到了一个数据流形的具体表示,具有语义上有意义和可解释的潜在空间方向。这些方向是按照它们与基础物理生成过程中物理 E