- 密度比估计的二元损失
从有限数量的密度观测结果中估计两个概率密度的比率是机器学习和统计学中的一个核心问题。本研究从一类 Bregman 散度中的预设误差度量出发,表征了导致密度比率估计具有小误差的所有损失函数,并提供了一个简单的构建具有特定属性的损失函数的方法。
- 随机 Pareto 前沿表面
通过极坐标,我们证明了帕累托前沿可以显式地参数化,从而基于此表示可以将线性代数、概率统计和决策理论推广至帕累托前沿空间中的函数。我们以随机设置为重点,研究了帕累托前沿作为随机过程的情况,并展示了如何定义和估计期望值、协方差和分位数等统计量。 - 最大熵编码的异常检测
使用默认分布和一组测试数据,本文探讨了是否可能由 P 生成 x^M。为离散分布问题,Kolmogorov-Martin-Löf 随机性提供了明确答案。我们试图将这个概念推广到连续分布,并考虑了一组统计量 T_1 (x^M),T_2 (x^M - 因果室:作为人工智能方法论实验台的真实物理系统
通过构建名为因果室的计算机控制实验室,研究人员可以在各个领域中快速、廉价地生成大量来自非平凡但易理解的物理系统的数据集,并提供一种丰富的算法测试平台,解决因果发现、分布外泛化、变点检测、独立成分分析和符号回归等问题。
- 基于最大似然估计的有向图聚类中的随机块模型
通过统计学的角度研究了有向图聚类问题,将聚类问题建模为有向随机块模型(DSBM)中估计底层社区的过程,并通过最大似然估计(MLE)推断出给定观察到的图结构的最可能的社区分配。此外,还建立了该 MLE 公式与新型流优化启发式算法之间的等价关系 - 机器学习中的重要度加权研究简述
通过密度比重方法,本研究论述了重要性加权在统计学和机器学习中的广泛应用及其与相关研究的关联。
- 基于 Transformer 的统计参数估计
基于 Transformer 的方法在参数估计中能够无需数学推导、密闭解、或概率密度函数,仅需单次推断即可根据样本观测值估计潜在分布的参数,与最大似然估计相比在常用分布上达到更高的精确度。
- 算法性能无假设测试的限制
对于限定的数据量,我们研究了算法评估与比较的理论极限,发现在黑盒测试下无法客观评价算法性能,除非可用数据点数远大于样本量。在评估特定训练模型性能方面则较为简单,只需要保留一组验证数据即可。同样地,我们探讨了算法稳定性假设是否足以解决问题,结 - $C^*$ 代数机器学习:迈向新方向
机器学习与数学领域诸如统计学、概率论和线性代数等有着长期的合作传统。我们提出了机器学习研究的新方向:$C^*$- 代数机器学习。这是 $C^*$- 代数与机器学习的交叉授粉。$C^*$- 代数数学概念是复数空间的自然推广,它能够统一现有的学 - 神经拉索:套索和神经网络的统一方法
利用统计学和机器学习相结合的方法,本文将变量选择的统计技术 Lasso 通过神经网络进行表示。观察到尽管统计方法和其神经版本具有相同的目标函数,但由于优化方法的不同而存在差异。为了更准确地估计参数,特别是在训练集较小的情况下,提出了一种模仿 - 机器学习的稀疏模型
通过提供稀疏建模和压缩感知的基本理论介绍,讨论了一些有效的方法来恢复优化问题的稀疏解,并介绍了稀疏恢复在稀疏字典学习中的应用。
- 具有局部可变测量尺度的随机变量的稳健统计比较
本文提出一种新的概率论序,可以用于量化非标准空间映射的随机变量期望之间的偏序关系,通过线性优化实现并用于实际领域
- 基于模型错误假定的仿真推断鲁棒统计学习
提出了一种通过惩罚那些增加数据和模型之间不匹配度的统计量的正则化损失函数作为一般性方法来处理模型错误规范问题,从而在 SBI 过程中获取稳健的推断结果。
- 可复制的强化学习
本篇文章探索了在机器学习中的可复制性问题,提出了一个可复制的算法架构和针对不同领域的可复制性解决方案,包括针对控制问题和批量学习设置的评估模型。
- 基于混合统计和机器学习算法的电力需求预测:以乌克兰为例
该研究使用统计学和机器学习方法来预测国家电力需求,构建了一个完整的长、中、短期电力需求预测模型,其中跨度长的年度趋势采用宏观经济回归分析,中期模型采用温度和日历回归器,短期模型通过多个 ARMA 模型来捕捉小时级别的季节性,结果表明两年外部 - 神经符号学博士:或者说,我如何学会不担心并接受统计学
该论文旨在解决符号人工智能界在集成机器学习、统计学和深度学习方面的文化障碍,提供了一种逐步协议,用于设计满足符号 AI 社区最低理论保证的机器学习系统。
- VAE 中证据的限制和对数似然的评估
本文提供了一种通用且有效的变分间隙上限估算方法,使得我们可以高效地对 VAE 模型的真实证据进行估算,并且借助我们的估算方法,容易获得 VAE 模型对数似然的上限和下限。
- MM面向统计学家和数据科学家的量子计算简介
该论文旨在为统计学家和数据科学家提供量子计算,量子算法和量子应用领域的概述,为他们接下来的研究和开发合作提供基础知识及信息。
- CVPR单领域泛化的对抗自适应归一化
本文提出了一种通用的标准化方法 — 自适应标准化和重新缩放标准化(ASR-Norm),通过神经网络学习标准化和重新缩放的统计数据,可以进一步提高单域泛化模型的范化能力,特别是在源域与目标域差异较大的情况下,该方法在 Digits、CIFAR - 分类中的噪音
本文探讨计算和统计方面的学习线性阈值的问题,特别是噪音的存在对该问题带来的影响及其应对方法。