- 似曾相识度量是最优传输距离,并且可以高效计算
我们提出了一种新的框架,用于在马尔科夫链之间制定最佳输运距离的形式化。我们将此问题转化为在约化空间中求解线性规划的问题,并且通过 Sinkhorn Value Iteration 方法计算最佳输运距离,从而得到与马尔科夫链的 bisimul - 使用 Rollout 算法生成 n-Grams、Transformers、HMMs 和 Markov Chains 的最可能序列生成
本研究提出了一种基于 $n$-gram 结构的 transformer 模型,并探讨了根据概率计算高可能性词序列的方法,以及基于单一策略迭代的推演方法,实验结果显示这些方法可以在计算量上进行适度的增加,同时生成高可能性的词序列。
- 借助马尔科夫链的注意力:通过马尔科夫链分析 Transformer 的原则框架
通过马尔可夫链的角度研究变压器的序列建模能力,并在理论和实验上研究数据分布特性、变压器结构、学习分布和模型性能之间的相互作用。
- 利用均方最大流和 Kemeny 常数进行马尔可夫链图神经网络的大规模训练
我们提出了使用图神经网络解决 Markov 链描述的动力学网络的图划分问题,通过使用编码器 - 解码器架构和简单的 GraphSAGE-based GNNs 能够在这个背景下胜过更大更有表达力的基于注意力的模型。
- 加速 Langevin 动力学的近端算法
基于随机化的 Nesterov 方案,我们开发了一类新颖的 MCMC 算法。我们通过适当地添加噪声,得到了一种时间非齐次的欠阻尼 Langevin 方程,并证明它的不变测度是一个指定的目标分布。同时,我们还建立了它在 Wasserstein - 学习伊辛模型的统一方法:超越独立性和有界宽度
从数据中有效地学习 Ising 模型的底层参数是我们重新审视的问题。我们展示了一种基于逐节点逻辑回归的简单现有方法在多种新颖环境下能成功地恢复底层模型的参数,包括从本地 Markov 链动态生成的数据、自旋玻璃的 Sherrington-K - 具有固定置信度的不安定赌博机中的最佳臂标识
在具有有限个臂的不安定多臂赌博问题中,通过分析某个马尔可夫决策过程及其状态 - 行动访问比例,确定最佳臂的策略和相应的期望停止时间,从而在有限的样本数、有限错误概率的条件下达到最佳臂的识别。
- 采样、优化和提升的广义伊藤链的伊藤扩散逼近
这项工作考虑了一类非常普遍而广泛的 Markov 链,即类似于某些随机微分方程的 Euler-Maryama 离散化的 Ito 链。我们研究的链是一个统一的理论分析框架,与大多数相关论文中的正常和状态独立的噪声不同,它具有几乎任意的各向同性 - 高阶 DeepTrails:*Trails 的统一方法
分析人类行为在不同环境中具有优势,理解和描述人类行为有助于改进和优化基础设施和用户界面。本文通过使用一阶马尔可夫链捕捉行为的数学特征,提出使用自回归语言模型分析整个序列的方法,以建模高阶序列依赖,解决现有方法中丧失信息和局限性的问题,并在合 - 广义浓缩条件下的马尔可夫链赫夫丁不等式
本文以积分概率度量 (IPM) 定义的广义可集中条件研究马尔可夫链的 Hoeffding 不等式,该广义可集中条件建立了一个框架,插值并扩展了马尔可夫链 Hoeffding 类型不等式的现有假设,我们的框架的灵活性使得 Hoeffding - 变分不等式中的随机方法:遍历性,偏差和改进
本研究旨在通过将常数步长随机外推算法(SEG)和随机梯度升降(SGDA)重新组合为时齐马尔科夫链来澄清并量化这些算法内在的概率结构,并证明了对于广泛的单调和非单调 VIP 而言,平均迭代数渐近地趋向于具有唯一不变分布的正态分布,从而带来了对 - 通过马尔可夫链实现常数步长 SGD 的收敛和集中特性
本文研究在强凸光滑目标下使用常数步长随机梯度下降的优化问题,通过马洛夫链的视角对其性质进行研究,证明了当梯度噪音分布满足一定条件时,该迭代过程以总变差距离或 Wasserstein-2 距离收敛于一个不变分布,同时证明了该极限分布具有次高斯 - 抽样、扩散和随机定位
通过扩展随机本地化过程并澄清扩散过程与随机本地化之间的联系,本文提出实现从高维分布中采样的有效技术,其中扩散过程的漂移通常表示为神经网络,并使用相应的算法从某些统计力学模型中采样。
- IJCAI在贝叶斯网络中找到一个 $ε$- 接近的参数变化
本文提出了一种基于 “区域验证” 技术的算法,旨在解决贝叶斯网络中的 ε- 接近参数调整问题,通过修改条件概率表中的概率值来满足定量限制,并且对包括具有多个 CPT 参数和不同 CPT 之间的参数依赖关系的极少接受关注的参数化 BN 子类进 - MCMC 中神经控制变量的理论保证
本文针对基于马尔可夫链的方差缩减问题提出了一种基于加性控制变量和最小化适当的渐进方差估计值的方法,重点研究了控制变量表示为深层神经网络的特殊情况,并在基于底层马尔可夫链的各种遍历性假设下,推导出了渐进方差的最优收敛速率。该方法基于方差缩减算 - 带质量保证的马尔科夫链混合模型学习
本文介绍了一种基于奇异值分解的算法,可以将用户轨迹聚类成具有公共序列模式的组,进而分析人类行为,并使用 EM 算法将其应用于混合马尔可夫链的重建,在合成和实际数据上的实验表明该算法在重建错误方面表现优于 GKV-SVD 算法。
- ICML关于时序差分学习的统计优势
本文介绍了使用 TD 方法估计值函数的优势,即使用一种新的度量方法 - 问题的轨迹跨越时间,可以在一定程度上提高两个状态的值差的测量准确性。
- 使用 HyperPCTL * 的多智能体系统贝叶斯统计模型检验
本文介绍了基于贝叶斯方法的统计模型检查(SMC)算法,用于在离散时间马尔可夫链(DTMC)上检查指定于逻辑 HyperPCTL * 的概率超性质;我们提出了一种基于递归算法的 SMC 超算法,该算法基于修改后的贝叶斯测试,考虑了递归可满足结 - ICLRGeoDiff:一种用于生成分子构象的几何扩散模型
本文提出了一种名为 Geodiff 的新型生成模型,它将分子中的每个原子视为粒子,并学习直接反向扩散过程来预测分子构象,通过 Markov 的方式进行建模,Markov 核通过维持等变性来实现不变性分布,实验表明,该方法在多个基准测试中优于 - KDD生成对抗网络的重参数采样
本文提出 REP-GAN,一种基于马尔可夫链重参数化的采样方法,能够在提高样本质量的同时大大提高采样效率。在合成和真实数据集上的广泛实验证实了 REP-GAN 的优越性。