概率向量排序与无监督性能评估

IJCAIJun, 2023

On Orderings of Probability Vectors and Unsupervised Performance Estimation

Muhammad Maaz, Rui Qiao, Yiheng Zhou, Renxian Zhang

TL;DR通常用于评估模型性能的无标签数据评估的方法，通过使用得分函数映射概率向量来提高效果，但是需要选用最佳得分函数，实验得出 L^∞范数是最合适的。

Abstract

unsupervised performance estimation, or evaluating how well models perform on unlabeled data is a difficult task. Recently, a method was proposed by Garg et al. [2022] which performs much better than previous methods. Their method relies on having a →

unsupervised performance estimation score function monotone transformations binary classification nlp datasets

发现论文，激发创造

非参数得分估计器

本文探讨了基于鲍姆 - 韦尔奇定理的 Stein 方法和 Score Matching 方法的核估计者，提出了一种基于正则化非参数回归框架的统一视角，允许我们分析现有的估计器并选择不同的假设空间和正则化器构建新的估计器。最后，我们提出了基于迭代正则化的分数估计器，它们受到无旋核和快速收敛的计算优势的支持。

May, 2020

高斯混合模型的两轮变种 EM 算法

本文探讨了 Bayesian 网络中无监督与有监督模型选择领域的差异，观察到标准边际似然得分标准并不能很好地适用于有监督模型选择，对比实证分析发现 Dawid 的预测序列原则的方法可以在该领域中获得最佳结果。

Jan, 2013

高斯过程得分函数的随机逼近

探讨无偏随机逼近的统计特性，通过模拟数据集得到有效计算、可比最大似然估计的技术，并通过 $2^n$ 阶乘设计元素改进算法得到更好的结果

Dec, 2013

直接优化排序度量

介绍了一种新的优化丢失功能的方法以提高 Web 页面排名和协同过滤的性能，并使用结构化估计在希尔伯特空间中进行直接优化，所提出的算法被证明是快速且表现良好。

Apr, 2007

基于得分的生成模型的可证明鲁棒性研究：一个不确定性量化的视角

通过不确定性量化的视角，我们证明基于得分的生成模型对实际实现中的多重误差具有可靠性。利用 Wasserstein 不确定性传播定理，我们展示了有限样本近似、提前停止、得分匹配目标选择、得分函数参数化表达能力以及参考分布选择所导致的误差如何影响生成模型的质量。Wasserstein 不确定性传播定理适用于超过 $d_1$ 的积分概率度量，如总变差距离和最大平均差距。我们的方法假设最少，与流形假设无关，并避免了目标分布的绝对连续性假设。此外，我们的结果阐明了 SGM 中多个误差来源之间的权衡。

May, 2024

基于成绩的生成模型在学习亚高斯概率分布族中克服了维度诅咒

分析使用得分为基础的生成模型在学习一类亚高斯概率分布时的近似和概括性，介绍了相对于标准高斯测度的概率分布的复杂性概念，证明了通过经验得分匹配生成的分布以维度无关的速率近似目标分布。通过包括某些高斯混合的示例说明了理论，证明中的一个基本要素是导出与正向过程相关的真实得分函数的无维度深度神经网络逼近速率，独立成趣。

Feb, 2024

评分估计的密码学难度

在样本复杂度与相关问题参数的多项式条件下，我们证明了在没有对数据分布进行强假设的情况下，$L^2$- 准确的评分估计在计算上是困难的。我们的研究基于 Chen 等人（ICLR 2023）的结果，他们证明了从未知数据分布生成样本的问题可以归约为 $L^2$- 准确的评分估计。我们难以估计的分布是最初由 Diakonikolas 等人（FOCS 2017）提出的 “高斯煎饼” 分布，根据在格基密码学领域的广泛公认的困难性假设，这些分布与标准高斯分布在计算上是不可区分的（Bruna 等人，STOC 2021；Gupte 等人，FOCS 2022）。

Apr, 2024

基于神经网络的扩散模型分值估计：优化与泛化

通过分析神经网络的数学框架和得分匹配与回归分析之间的创新连接，本文提出了第一次得分函数学习的一般化误差（样本复杂性）边界，从而克服了观测值中存在噪声的问题。

Jan, 2024

具有基于评分的结构先验知识的部分已知高斯图模型估计

我们提出了一种新的算法，用于部分已知高斯图模型的支持估计，该算法结合了关于底层图的先验信息。 im 简化后，我们通过伯努利分布生成图数据集，然后使用图神经网络有效地估计图先验的评分。数值实验证明了我们方法的优势。

Jan, 2024

高维数据成对样本假设检验框架

在多维配对样本测试中，我们提出了一种得分函数的生成方法，通过连接每对样本的垂直平分线的决策规则进行定义。然后，我们通过广义化的 Hodges-Lehmann 估计器来估计这些规则的伪中值，从而得到最优得分函数。我们提出了一个两步测试过程的框架，通过此框架可获得在测试准确性和特征贡献估计方面相较于传统多元和多重测试具有显著性能提升的方法。

Sep, 2023