学习马尔可夫链

NIPSOct, 2018

On Learning Markov Chains

Yi Hao, Alon Orlitsky, Venkatadheeraj Pichapati

TL;DR研究分析了来自样本的未知 Markov 链的估计问题，特别是预测下一样本的条件分布和转移矩阵的估计问题。研究利用 KL 散度和 f - 散度探讨了这两个问题的 min-max 风险，得出了它们的风险界限和上界。

Abstract

The problem of estimating an unknown discrete distribution from its samples is a fundamental tenet of statistical learning. Over the past decade, it attracted significant research effort and has been solved for a variety of divergence measures. Surprisingly, an equally important problem, estimating an unknown →

markov chain kl-divergence f-divergence estimation probability

发现论文，激发创造

利用秩约束似然估计马尔科夫链

本文提出了一种基于秩约束的极大似然非凸估计方法，采用差分凸函数编程算法解决优化问题，实验结果表明该方法在低秩马尔科夫链估计方面具有更好的性能。

Apr, 2018

离散状态空间上的遍历马尔可夫链核的统计估计

本文研究了从一个单一的长序列状态观测中估计离散状态马尔可夫链核参数的统计复杂性。我们表征了（模对数因子而言）在算子无穷范数意义下估计最小化信赖样本复杂度的有限情况，而在可数无限情况下，我们则分析了基于总变差导出的自然逐项方式规范的问题。我们证明，在这两种情况下，样本复杂度取决于未知链的混合特性，在有限状态情况下，已知有完全经验置信区间的有限样本估计器。

Sep, 2018

最小概率流学习

本文提出了一种新的参数估计技术，该技术无需计算不可处理的归一化因子或从模型的平衡分布中采样，通过建立动态算法将观测到的数据分布转化为模型分布，并通过使得数据分布与运行该动态算法的分布的 KL 散度最小化来进行优化，在 Ising 模型等情况下展示比当前先进技术更快的学习效率和更低的误差。

Jun, 2009

KL 散度的估计：最优极小极大速率

研究在字母表大小可以无限扩展的假设下，基于从 P 中抽取 m 个独立样本和从 Q 中抽取 n 个独立样本，估算两个未知分布 P 和 Q 之间 Kullback-Leibler 差异的问题，并提出了改进后的插件估计器和最小二次风险最小值估计器。

Jul, 2016

离散分布间差异的最小化最优估计

通过构建一个使用混合方法的线性规划，解决非平滑区域的矩匹配问题并在平滑区域应用问题相关的偏差校正插入估计符的第一种极小估计，我们研究了整数 α≥1 下离散分布的 α- 距离的最小极大估计。

May, 2016

在 l1 损失下的离散分布的最小极小值估计

该研究分析了离散分布估计问题，并提供了最大风险和最小极小风险的上下界，进而得出在特定条件下最大风险极小风险的渐近性能。通过该研究可得出在经验分布估计中的渐近最大风险和最小极小风险，并且通过对概率分量估计确定了渐近最小极小风险。

Nov, 2014

离散分布函数的最大似然功能估计

针对离散分布函数的函数估计问题，利用浓度不等式和正线性算子逼近理论分析了 MLE 估计器的最坏情况的平方误差风险及其期望偏差。研究表明，MLE 在估计香农熵和 F_α(P) 产生了次优的样本复杂度，且 Dirichlet 先验平滑技术不能达到最小化极值。

Jun, 2014

马尔可夫模型中的快速双向概率估计

本研究开发了一种双向算法来估计马尔可夫链的多步转移概率，该方法适用于离散状态空间上的任何马尔可夫链，可以用于计算多步转移概率的函数，并且在 “稀疏” 马尔可夫链中，该方法的运行时间比 Monte Carlo 和功率迭代算法更小。

Jul, 2015

自适应熵估计

本研究针对离散分布 P 进行 n 个独立同分布样本的香农熵估计，使用逼近理论法进行估计，实现了在估计熵的最小二乘率方面的极致。通过采用自适应估计框架，该方法相对极小值优化估计方法在分布 P 的嵌套子序列上实现了最小二乘率的估计，从而进一步证明了估计在样本 n 的情况下是最优的，并且基本上相当于 MLE 使用 nlnn 个样本进行估计。

Feb, 2015

带有马尔可夫数据的最小二乘回归：基本限制和算法

研究了最小二乘线性回归的问题，其中数据点依赖于并从马尔可夫链中采样。在不同的噪声设置下，建立了关于底层马尔可夫链混合时间 $\tau_{mix}$ 的尖锐信息理论极小值下界来解决此问题。我们发现，与独立数据的优化相比，具有马尔可夫数据的优化通常更加困难，一个只在大约 $ ilde {\Theta}(\tau_{mix})$ 个样本中工作的平凡算法 (SGD-DD) 是极小化最优的。此外，我们还研究了实践中出现的结构化数据集，例如高斯自回归动态，它们能否拥有更高效的优化方案。令人惊讶的是，即使在这个特定的自然环境下，具有一定步长的随机梯度下降法与常数并没有比 SGD-DD 算法更好。相反，我们提出了一种基于体验复盘的算法 —— 一种流行的强化学习技术 —— 它可以实现更好的误差率。我们的改进速率是第一个在有趣的马尔可夫链上优于 SGD-DD 的算法之一，也为在实践中支持使用经验回放提供了首个理论分析。

Jun, 2020