- ICML严格适当评分规则的语言生成
基于最大似然估计(MLE)的语言生成是文本生成的基本方法之一。本文提出了一种简单的策略,用于适应语言生成中的评分规则,并使用两种经典的严格适当评分规则 ——Brier 得分和 Spherical 得分进行训练,从而显著提高了模型的生成能力。
- 图像质量评估的感知恒定性约束的单一意见分值校准
本文提出了一种高效的方法,从单个意见分数(SOS)估计图像的平均意见分数(MOS),通过最大似然估计来表征 MOS。我们假设每个 SOS 是正态分布的观测样本,MOS 是其未知期望值,并考虑了成对图像的感知相关性以对 SOS 的似然建模。通 - 一种伪似然方法的修正
我们给出一个反例来说明最大伪对数似然估计失败,并提供了解决方案来纠正文章中提出的算法。
- 通过拟合二项分布评估感知距离的两个选择数据
本文使用双选强迫选择实验(2AFC)的统计建模方法,通过最大似然估计来适配分布,对感知判断进行评估,并计算不同距离下的判断可能性,从而解决了在感知数据中减少判断数目的问题,同时强调了神经网络方法所缺少的关键要素。
- 智能大规模随机接入的盲标准化 Stein 变分梯度下降检测
提出了一种基于极大似然估计模型的新型早期前导检测方案,通过探索 Hadamard 变换和小波变换之间的关系,发展出了改进的 Hadamard 变换(MHT),并通过引入块 MHT 层、缩放层、软阈值层、逆 Hadamard 变换和稀疏惩罚来 - 粒子梯度下降的误差界和对数 - 索伯列夫和塔拉格兰不等式的推广
非渐近误差界限
- 噪声对比估计与对比散度之间的关联
通过将噪声对比估计(NCE)方法与传统最大似然估计(ML)方法结合,以及探索 NCE 与条件重要性采样(RNCE)和对比散度(CNCE)之间的关联,本研究实现了 NCE 方法的扩展和改进。
- 自动编码贝叶斯逆博弈
基于贝叶斯观点和变分自编码器,提出一种解决交互式运动规划中的逆游戏问题的方法,通过构建后验分布来量化未知参数的不确定性,并且在处理连续、多模态分布时具有高效性。在模拟驾驶场景中的广泛评估中表明,该方法成功学习先验和后验目标分布,相比 MLE - 面向鲁棒性模型驱动增强学习抵御对抗性破坏
这项研究处理了模型驱动的强化学习中的对抗性损坏方面的挑战,其中转移动态可能会受到对手的损坏。通过引入最大似然估计方法来学习转移模型,我们提出了旨在解决联机和脱机设置中的对抗性损坏问题的算法,并证明了这些算法的性能和下界。据我们所知,这是关于 - 高维贝叶斯优化的标准高斯过程
对高维优化问题进行系统研究发现标准高斯过程贝叶斯优化(BO)在很多合成和真实世界基准问题中表现出色,在高维优化上经常比专门设计的现有 BO 方法更出色,同时具备适应各种目标函数结构的鲁棒性,单纯使用最大似然估计即可获得有前景的优化性能,不需 - 温度对于 Softmax 高斯专家混合模型的采样效率是否高?
稠密到稀疏门控专家混合模型(MoE)是稀疏 MoE 的有效替代,本文分析了稠密到稀疏门控 MoE 对高斯 MoE 下的极大似然估计的影响,并提出了一种新的激活稠密到稀疏门,以改善参数估计速率。
- 尝试从生成流的潜空间中生成新的桥梁类型
本文介绍了归一化流在高维矩阵行列式计算和神经网络可逆变换这两个应用挑战中的巧妙应用,并使用三孔梁桥、拱桥、斜拉桥和悬索桥的对称结构图像数据集构建和训练了基于 TensorFlow Probability 库中的 Glow API 的归一化流 - TripleSurv: 三元时间自适应坐标损失 用于生存分析
通过引入样本对的生存时间之间的差异来实现自适应调整,基于时间的自适应坐标损失函数 TripleSurv 能够鼓励模型定量地排列出一对的相对风险,从而提高预测的准确性,评估结果显示 TripleSurv 在模拟和真实生存数据上表现优于现有方法 - 学习丰富排序
采用基于选择建模的上下文重复选择(CRS)模型,结合多模态模型,提供了生成丰富的排名空间的工具,同时使用结构相关的尾部风险和期望风险界限,对该模型的最大似然估计提供了严格的理论保证,并且在多项式逻辑选择模型(MNL)和 Plackett-L - 动量粒子极大似然
最大似然估计(MLE)的潜变量模型常常被重新设定为参数和概率分布的扩展空间上的优化问题。我们提出了一个受动力系统启发的方法,结合了 Nesterov 的加速梯度法、欠阻尼朗之万方程和粒子方法,使得该算法在连续时间中收敛到函数的唯一最小值。通 - 通过双 MCMC 教学学习基于能量的模型
本文研究了基于能量的模型(EBM)的基本学习问题,通过最大似然估计(MLE)和生成模型的联合训练来提高 EBM 的学习效果。
- 从反应式到主动式波动建模:半球神经网络的应用
我们通过具有专门的均值和方差半球的新型神经网络架构,给宏观经济密度预测重新注入了最大似然估计(MLE)。我们的架构具有几个关键要素,在这个背景下使 MLE 工作。
- 最大似然估计是处理良好指定的协变量转移的唯一所需方法
现代机器学习系统的一个关键挑战是实现越界通用化(OOD generalization)- 广义到与源数据分布不同的目标数据。本文证明了在针对协变量转移的规范设置下,令人惊讶的是,纯使用源数据(无需任何修改)的经典最大似然估计(MLE)达到了 - 关于概率主成分分析最大似然估计的一致性
利用商拓扑空间,我们提出了一种新的方法解决概率主成分分析模型中的参数唯一性问题,并证明了最大似然估计解是在适当商欧几里得空间中一致的。此外,我们的一致性结果适用于 MLE 之外的更广泛的估计器类,并且在紧致性假设下,建立了 MLE 估计的强 - 超越 MLE:文本生成的凸学习
基于凸函数的训练目标提供了一种新颖的方法,使得文本生成模型能够聚焦于高概率输出,同时增强了自回归模型与非自回归模型的生成能力。