- 学习漂移离散分布的改进算法
我们提出了一种适用于在分布漂移下学习离散分布的新的自适应算法。
- 基于梯度的离散采样与自动周期调度
多模离散分布的高效准确采样中,我们提出了一种自动循环调度方法,其中包括循环步长调度、循环平衡调度和自动调整超参数的方案,并证明了其在一般离散分布上的非渐近收敛性和推理保证。广泛实验证明了该方法在采样复杂多模离散分布方面的优势。
- 基于分配流形上的 E - 泛地测流匹配的离散联合分布生成建模
该研究介绍了一种新颖的生成模型,基于连续归一化流在分解离散度量子流形上。在逐渐整合流中分配类别,避免了离散化潜在连续模型时出现的舍入、样本截断等问题。通过将子流形嵌入到所有联合离散分布的超单纯体中并进行数据驱动的平均,可以逼近能表示结构离散 - 条件熵的因果分层
从可观测数据中,通过条件熵预言的方式,我们提供了一种恢复图层次结构的方法,以离散分布为前提,并以删除图中源或汇的方法来验证算法的正确性和纠正性。
- 混合变分流用于离散变量
开发了一种不需要连续嵌入的离散分布的变分流,称为 MAD Mix,通过测量保持和离散可逆映射来生成离散目标的可靠逼近,并且比连续嵌入的流训练速度显著更快。
- 高概率离散分布的最佳测试
研究总变差距离下的离散分布测试问题,提出可用于样本较高概率区域的属性测试的算法,包括相应参数的样本复杂度与正确性保障。
- 学习离散分布:用户与物品级隐私
本文研究了基于用户级差分隐私的离散分布学习问题,提出了一种新的实现方法,使隐私惩罚的数量级小于标准机制在某些感兴趣的设置下,并进一步展示了该建议机制在某些范围内是几乎最优的。同时,本文还提出了一些获取受限差分隐私的估计量下限的通用技术以及二 - 离散分布的斯坦变分推断
该研究提出了一种将离散分布转换为等效分段连续分布的方法,然后使用无梯度的 SVGD 进行高效的近似推理,并证明了该方法在离散图形模型的各种测试中优于传统的算法,同时优于其他广泛使用的集成方法,特别是在学习 CIFAR-10 数据集上的二值化 - 批量鲁棒学习的通用方法
研究了在数据存在噪声和对抗性的情况下如何进行鲁棒学习,同时提出了有效的学习算法来解决分段区间分类和分布估计的问题。
- 离散流:可逆离散数据生成模型
本文探讨了 normalizing flows 模型在离散分布上的应用,提出了可以推广到离散事件的离散流模型。其中考虑了离散自回归流和离散二部流模型, 并应用于语言模型中。实验证明于离散分布上离散自回归流优于自回归基线模型,在字符级别的语言 - 测试离散分布的条件独立性
研究了离散分布的条件独立性检验问题,并给出了样本复杂度的上下界,提出了第一种具有次线性样本复杂度的条件独立性测试器,用于对分布属性进行测试。
- 离散分布形状约束的检验
本文主要研究了离散分布的结构性质(类),提出了一个通用的算法,可以测试各种形状约束的属性,包括单调、对数凹、t - 模态、分段多项式和泊松二项式分布。此外,对于所有考虑的情况,算法在领域大小方面具有近乎最优的样本复杂度,并且计算效率高。
- 使用不均等大小的样本进行接近度测试
考虑从一个未知分布 $p$ 取 $m_1$ 个样本,从另一个未知分布 $q$ 取 $m_2$ 个样本的情形,介绍了一种测试是否有 $p=q$ 的快速算法,并分析了测试的样本复杂度,同时提出了估计马尔科夫链混合时间的算法及其初始样本个数的选择 - 关于 $d$- 无关随机变量的联合熵
研究了 n 个 d - 元独立离散随机变量的联合熵在个体分布限制的约束下的最小值,提出并改进了已有的结论,并在特殊情况下证明了匹配的上限和最低值的下限。
- 离散分布函数的函数估计极小化
本文提出了一种构建广义极小极大估计器的方法,以及一个基于多项分布的特殊案例。并在熵和互信息估计领域展示了这一方法的实用性和优势。
- 离散分布相似度检测的最优算法
本文研究了对于两个离散分布的近似度检测问题,给出了一些用于信息理论最优的简单测试方法,并且在 $n$ 和 $\eps$ 的依赖关系上都达到了常数因子。
- 不充分抽样的熵估计
本论文详细介绍了针对离散分布的 Shannon 熵估计器的一些估计方法,适用于 N 个样本点分布到 M 个箱中,其中 N 和 M -> oo,但 N/M < oo,高采样区域(每个箱子 <<1 个点)具有指数级小的偏差,低采样区域的误差增加