- 优化自然梯度替代品的分布
通过引入替代分布参数的优化,我们提出了一种用于克服自然梯度计算困难的新技术,该方法适用于多种问题,并且扩展了可以高效利用自然梯度的分布集合,可用于最大似然估计和变分推断任务。
- EMO: 自回归语言建模的地球移动距离优化
神经语言模型是人类文本的概率模型,主要使用最大似然估计进行训练。本文提出了基于 EMD 优化的自回归语言建模方法,通过对 EMD 的上界估计实现了端到端训练,并在广泛评估中表现出了比 MLE 更好的语言建模性能。此外,EMO 还能在仅微调 - 最大似然估计的潜变量结构方程模型:一种神经网络方法
我们提出了一种在线性和高斯假设下对结构方程模型稳定的图形结构,证明了计算这个模型的最大似然估计等价于训练一个神经网络,并实现了基于 GPU 的算法来计算这些模型的最大似然估计。
- 基于学习的实时微弱太空碎片探测器
本文提出了一种基于局部对比度和最大似然估计的低信噪比杂线提取方法,可高效检测信噪比为 2.0 的空间物体,具有高速和高精度,保证了在高动态目标提取方面具有广泛应用前景。
- 从一个数据集到另一个数据集的流动:最大似然估计的变形
利用正则化流模型,在没有明确知道数据集概率密度的情况下,通过最大似然估计训练正则化流,实现从一个数据集到另一个数据集的变形策略,并研究数据点的移动程度以统计匹配两个数据集,同时以特定特征为条件来生成变形函数。
- 通过合作扩散恢复似然学习能量模型
我们提出了协同扩散恢复似然 (CDRL) 方法,该方法通过在逐渐噪声增加的数据版本上定义一系列的能量基模型 (EBM),并配对每个 EBM 的初始化模型,以从 EBMs 学习并采样,从而显著提高了样本质量。在 CIFAR-10 和 Imag - 生成式人工智能的强化学习综述
深度生成人工智能是机器学习社区中长期关注的重要话题之一,能够影响文本生成和计算机视觉等多个应用领域。最大似然估计是训练生成模型的主要范式,通过减少模型分布和目标分布之间的差异来捕捉和近似目标数据分布。然而,该目标无法满足用户对生成模型的全部 - 基于统计的列子集选择视角
在这篇论文中,我们研究了从大数据集中选择一个小的代表性变量子集的问题,并且证明了计算机科学文献中的维数约简问题(Column Subset Selection)和统计学文献中的寻找最大信息变量集的问题是等价的,同时也可以在一定的半参数模型中 - 通过在神经机器翻译训练中使用对比标记来增强监督学习
本文提出了一种新的监督学习方法,通过对标准最大似然估计方法进行对比标记优化,特别适用于从修改后的翻译中学习,进一步提高了神经机器翻译的性能。
- 关于预测有界时间序列时跟踪变化边界的研究
我们考虑一个新的框架,其中一个连续但有界的随机变量具有随时间变化的未观察到的边界,并在有界随机变量的分布的参数上考虑边界。我们引入了扩展对数似然估计,并设计算法通过在线最大似然估计来跟踪边界。由于所得到的优化问题不是凸的,我们利用最近关于凸 - 半渗透最大似然估计法学习图像描述生成
本文介绍了 Semipermeable MaxImum Likelihood Estimation (SMILE) 模型,该模型允许富度优化而阻止简洁度优化,从而鼓励模型生成更多细节的长字幕。实验证明,SMILE 显着提高了生成字幕的描述性 - 概率展开优化:面向潜在高斯模型的可扩展、无需反演的最大似然估计
本文提出了一种用概率展开和迭代线性求解器相结合的方法,以绕过矩阵求逆的问题来学习潜在高斯模型,在实验中发现,这种方法可以比传统梯度期望极大化算法快一个数量级地学习潜在高斯模型。
- 借助人类反馈的强化学习:通过悲观主义学习动态选择
本文提出了一种基于动态离散选择模型的离线强化学习算法,通过最大似然估计来估计人类行为策略和状态 - 动作价值函数,通过最小化贝尔曼均方误差来恢复人类奖励,然后调用悲观值迭代算法来寻找接近最优的策略。该算法是离线 RLHF 的理论担保,并且在 - 带有 Hawkes 进程的异构事件动态下的短期时间依赖检测
本文提出了一种用于短期时间依赖检测的鲁棒计算方法,该方法使用不依赖于异质性目标 HP 的交互 HP 的异质性强度,取消了异质性强度的先验估计,并在神经科学中得到了显着的新应用,实验结果表明该方法比现有方法表现更优。
- ACLMixCE: 通过混合正向和反向交叉熵训练自回归语言模型
本文提出使用 MixCE 目标函数来学习自回归语言模型,该目标函数结合了前向交叉熵和反向交叉熵,以更好地生成类人文本。实验表明,在合成数据和真实数据上,使用 MixCE 训练的模型生成的文本比使用传统方法更好。
- 神经网络的效用概率对偶
该研究通过提出基于需求的代替概率的解释来解释深度学习在语言生成任务中的成功,以较大程度上消除了这种学习方法中的悖论,并提出了一个新的公式,用于将学习到的效用值转换为一种新的概率估计,从而使概率兼容决策规则的性能得到大幅度提高,并揭示了现代神 - 不精确标签学习:一种统一的学习框架用于处理各种不精确的标签配置
本文介绍了不精确标签学习 (ILL) 框架,它是处理各种不精确标签配置的统一方法,利用期望最大化 (EM) 算法进行最大似然估计 (MLE) 的不精确标签信息,并将精确标签视为潜在变量。与以前的多功能方法相比,我们的 ILL 框架考虑了由不 - 针对具有不完整信息的文本生成的对抗非自回归模型
本文提出一种新型的 Non-autoregressive Transformer 模型,即 Adversarial Non-autoregressive Transformer,在 Incomplete Information Scenar - 基于多核相关熵的 IMU 定位估计:梯度下降方法
本研究提出了基于经验熵的逐步下降法和分离方向估计的两种计算高效的惯性测量单元(IMU)方向估计算法,并证明了多核心经验熵损失(MKCL)作为一种最大似然估计(MLE)的最优目标函数,适用于一种重尾分布的噪声。使用 MKCL 替换标准的 MS - 基于数据驱动的状态聚合方法用于动态离散选择模型
本文提出了一种基于数据驱动的算法来选择和聚合状态和估计动态不连续选择模型的最大似然结构参数,采用了先进的逆强化学习和聚类算法来减少计算和样本复杂度。