本文针对 Bayesian 统计推断中模型拟合的评估方法,提出了一种新思路,即把边缘似然与采用信息熵对数作为评分规则的对于所有大小为 p 的测试数据集迭代得出的穷举式的 leave-p-out 交叉验证等效形式,并探讨了边缘似然对先验选择敏感性的问题。同时,作者提出了累积交叉验证的替代方案。
May, 2019
这篇研究论文探讨了边缘似然估计在学习约束和假设检验方面的吸引力特性,以及在深度神经网络中超参数学习、神经结构搜索等方面的一些挑战,提出了条件边缘似然作为一种较为实用的修正方法,以更好地反应泛化能力。
Feb, 2022
作为深度学习中模型选择的有前途的边际似然方法由于参数估计上的困难很少被使用。本研究提出了可伸缩的边缘似然估计方法,用于基于训练数据独立地选择超参数和网络结构。该方法建立在拉普拉斯方法和高斯牛顿逼近的黑塞矩阵的基础上,并在标准回归和图像分类数据集上表现优异。此外,该方法还能够在缺少验证数据(例如在非平稳设置中)时提高一般化性能。
Apr, 2021
通常用于评估模型性能的无标签数据评估的方法,通过使用得分函数映射概率向量来提高效果,但是需要选用最佳得分函数,实验得出 L^∞范数是最合适的。
Jun, 2023
这篇论文提供了一种基于边际集似然函数的半参数推断方法,用于分析具有不同类型的多元数据,如二进制、次序和连续型数据,通过相互参数化变量的联合分布和单变量边际分布来实现混合数据分析。其 Gibbs 采样算法适用于高斯协方差模型的参数估计和推断。
Oct, 2006
高维度不平衡数据中,无监督特征选择方法对于后续算法的成功至关重要。为此,我们提出了一种更适用于不平衡数据的边缘拉普拉斯得分(Marginal Laplacian Score,MLS)算法,并将其集成到现代特征选择方法中,形成 DUFS-MLS。该方法在合成数据和公共数据集上展示了鲁棒性和改进性能。
Nov, 2023
通过非标准的参数化最大后验概率估计,基于块对角矩阵逼近提出了一种基于似然函数的模型选择方法,同时辅以残差离散度估计来度量模型的拟合程度,并提供了实例来说明模型选择和与标准技术的比较。
Sep, 2011
该论文对比了几种在实际模型选择问题中广泛使用的贝叶斯模型选择方法,重点关注回归和分类的变量子集选择,并使用模拟和现实世界的数据进行了几次数值实验。结果表明,考虑到模型不确定性是预测效果最好的。此外,投影法明显优于交叉验证得分的基于选择的方法,并且交叉验证在指导模型大小选择和评估最终选择的模型的预测性能方面大有裨益。
Mar, 2015
基于随机截断无限序列,提出了一种针对潜变量模型的对数边缘似然及其梯度的无偏估计方法,并采用编码器 - 解码器架构对编码器参数进行优化,以最小化估计方差。该估计方法不仅适用于训练模型,还可用于无偏估计和反向 KL 散度最小化等任务。实验结果表明,该方法可以提高模型测试集的可能性。
Apr, 2020
基于正样本和未标记数据的学习(PU 学习)是一种积极研究的机器学习任务,目标是基于包含部分标记的正样本和未标记实例的训练数据集训练一个二元分类模型。本研究提出了一个优化算法,通过建立标签机制、估计倾向性分值和进行参数优化,以实现风险一致性和更有效的方法。
Dec, 2023