- ACL语言模型可以通过概率差异进行自我评估
通过证明大型语言模型在回答问题时,如果它们更为熟练,显示更均匀的概率分布,我们启发性地讨论了这个问题。在此基础上,我们提出了一种新的自我评估方法 ProbDiff,用于评估各种语言模型的效能。该方法利用被测试的语言模型计算初始回答与修改版本 - CVPRDiffHuman:人体的概率光真实三维重建
DiffHuman 是一种基于概率的方法,通过一个单一的 RGB 图像实现逼真的三维人体重建。与确定性方法不同,DiffHuman 根据二维图像预测三维重建的概率分布,可以生成与图像一致的多个详细的三维人体模型。此外,DiffHuman 还 - 高维度中的嵌入向量估计
基于一种概率模型,研究了嵌入学习在离散数据中的可学习性,并提出了一种用于估计的低秩近似消息传递方法,探讨了样本数量、词项频率和嵌入相关性对概率分布的影响。通过对合成数据和真实文本数据的模拟验证了理论研究的可行性。
- 无时间标签下的数据动力系统重建
我们研究了一种从没有时间标签的数据中重构动态系统的方法,并将其作为来自概率分布的样本,通过最小化分布损失,具体而言是切片 Wasserstein 距离,试图重构潜在的动态系统。大量实验结果证明了所提方法的有效性。
- 通过温度调整的惊奇度提高对人类阅读时间的拟合
通过概率校准的概念,本文首次关注人类阅读模拟的概率分布,提出使用温度调整的意外度作为预测人类阅读时间的指标,通过三个数据集的实验证明这种意外度可以显著提高阅读时间的预测,在本文的设置中,将温度设置为大约 2.5 可使对数似然度增加 89%。 - 概率编程中的 Pearl 和 Jeffrey 更新作为学习模式
更新概率分布的概念是统计学和机器学习的核心。本文通过描述二者的概率编程和采样语义的方式以及不同的似然度(针对 Pearl 和 Jeffrey)来阐明它们的关系。此外,还展示了 Jeffrey 的更新规则是通过变分推理得出的。在范畴概率论中, - 流动中的采样:扩散与自回归神经网络的自旋玻璃视角
利用流水、扩散或自回归神经网络等生成模型进行的抽样分析工作,发现在某些参数范围内,这些方法可能无法高效抽样,而标准的 Monte Carlo 或 Langevin 方法则可行。然而,在其他参数范围内,这些生成模型的方法效果更好,而标准方法却 - 一种针对神经机器翻译模型的对抗攻击松弛优化方法
本文提出了一种基于优化的对抗攻击方式来攻击神经机器翻译模型,并在实验中取得了成功的效果,同时提出了针对黑盒攻击的扩展方法。
- 神经网络的效用概率对偶
该研究通过提出基于需求的代替概率的解释来解释深度学习在语言生成任务中的成功,以较大程度上消除了这种学习方法中的悖论,并提出了一个新的公式,用于将学习到的效用值转换为一种新的概率估计,从而使概率兼容决策规则的性能得到大幅度提高,并揭示了现代神 - 可学概念的语义沟通
该研究提出了一种通过学习算法来优化概率分布并将其传输到受限通道中的方法,从而在保证模型准确性的前提下降低数据失真,同时介绍了一种经验协调概念与网络中的强协调概念。
- CVPRHuManiFlow: 在 SO (3) 流形上,对祖先进行调整的正则化流,用于人类姿势和形状分布估计
本文介绍了一种名为 HuManiFlow 的方法,利用概率分布和正规化流预测 3D 人体姿态和形状,同时具备准确性、一致性和多样性,解决了估计不明确的问题。
- ICML生存分析的适当评分规则
本篇论文研究了四种主要的适用于生存分析中的严格得分规则推广,并且证明了这些扩展在离散化条件下是适当的,并通过真实数据集比较了这些扩展得分规则的估计性能,发现对数分值和布赖尔分值的扩展效果最好。
- 贝叶斯网络近似最优度数测试
本文研究了在给定概率分布 P({0,1}^n 上),并具有样本访问的情况下,测试潜在贝叶斯网络的最大入度的问题。研究表明,该问题的样本复杂度为 Θ(2^(n/2)/ε^2) 。我们的算法依赖于先前用于获得样本最优测试器的测试通过学习框架; - r-softmax:具有可控稀疏率的广义 Softmax
本篇论文提出了 r-softmax,一种可以控制稀疏度率的 softmax 修改方案,不同于其他现有的稀疏概率映射函数,我们提供了一种直观的机制来控制输出的稀疏程度。我们在多个多标签数据集上展示了 r-softmax 的优异表现,并证明了在 - 闭合曲线的高斯模型
本文提出了一种用于探测数据中复杂模板的闭合曲线的密度表示方法,并构建了该方法的混合概率分布,实验证明其在一维封闭曲线情况下的有效性。
- 为终身机器学习生成准确的虚拟实例
本研究旨在解决终身机器学习模型在接收新信息而不影响先前学习经验的情况下的知识整合问题,在不使用先前任务的训练示例的情况下,通过任务练习方式创建一个知识整合网络,同时使用训练后的 Restricted Boltzmann Machine 所产 - 对抗生成网络(GAN)的理论基础与应用
这篇论文介绍了生成对抗网络的理论基础、基本架构方案和一些应用。生成对抗网络是一种基于两个神经网络 —— 生成器和辨别器的对抗性学习方法,可用于计算机视觉、自然语言处理等领域。
- 一种与测度相关的紧凑语言模型特征化方法
这篇论文采用了度量理论的方法来对自然语言处理中的语言建模进行精确的描述,并证明了许多流行的语言模型家族本质上是紧密的,从而避免了概率可能会 “渗漏” 到无限序列集合中的问题。同时也推广了之前一些关于紧密性的特征描述。
- ICML从因果对到因果图
通过概率分布和因果关系特征,提出了一种计算效率高的因果结构学习方法,并在合成和真实数据集上进行了验证。
- 使用变分自编码器进行潜变量建模:一项调查
本文深入探讨了概率分布和变分自编码器的理论,并总结当前研究现状;适合机器学习初学者了解概率分布学习中的核心思想及其在深度学习领域的应用,并为此子领域的新参与者提供了一个适宜的入门机会。