- 马尔可夫决策过程中无界每步成本的模型近似
设计控制策略时,我们考虑在只有近似模型的情况下对无限时域折扣成本马尔可夫决策过程进行控制。对于在原始模型中使用近似模型的最优策略的性能如何,在原始模型中使用的近似模型的价值函数与原始模型的最优价值函数之间的差异的加权范数提供了上界的边界。通 - 一种关于连续随机变量右尾概率的新型上下界
该研究提出了一种全新类型的上限和下限,用于表示具有无界或左半无界支持的连续随机变量的右尾概率。这些新的上限和下限只依赖于概率密度函数(PDF)、其一阶导数和两个用于收紧边界的参数,并在特定条件下成立。通过数值示例,证明了这些尾部边界对于广泛 - 带有胖碎维度的改进均匀收敛界限
本研究提供了一种新的均匀收敛界,用于描绘实值函数的碎脂维度,消除了现有下界与最先进上界之间的开放间隙,其复杂度乘以一个对数平方因子。
- Krylov 方法在低秩近似中(几乎)是最优的
本文通过矩阵向量乘积模型和多种 Schatten norm 下的 rank-1 低秩逼近问题,证明了 Krylov methods 几乎达到了谱(p=∞)、Frobenius(p=2)和核(p=1)LRA 的信息论最优矩阵向量乘积数量的上界 - ICLR无监督领域自适应的信息论分析
本文使用信息理论工具来分析无监督域适应(UDA)中的泛化误差。 为两种泛化误差提供新的上界,第一种措施评估目标域和源域的总体风险之间的差距,第二种措施评估目标领域的总体风险和源域的经验风险之间的差距。 本文提出两种简单的技术来改善 UDA - 通过决策边界理解深度学习
发现决策边界变异性较低的神经网络具有更好的泛化性能;提出了算法 DB 变异性和(ε,η)- 数据 DB 变异性对决策边界变异性进行度量,并在理论上提出了两个基于算法 DB 变异性的下界。
- 在分配具有不确定需求的资源时实现公平和利用
本文研究了资源分配中公平性和利用率之间的平衡问题,并探讨了在需求分布不均时的公平性要求,得到了一些不同概率分布下的可证明的最大可使用率上界,发现了某些类型的概率分布下最大可使用率不受公平性约束,并且在幂律分布中求解的间隔可以由与分布参数无关 - 使用 L-Lag 耦合估计马尔可夫链的收敛性
使用 L - 滞后耦合生成可计算的、非渐近的上界估计来比较不同的 MCMC 算法,进一步评估了串行蒙特卡罗和自归一化重要性抽样器的偏差。
- 有限 VC 类的递归教学维度的二次上界
本文研究了有限大小概念类的递归教学维度 (RTD) 与 VC 维度 (VCD) 之间的定量关系,并找到了 RTD 的二次上界。
- 对抗性赌博机的改进下界
该研究提供了敌对强盗算法必须遭受的遗憾的新的下界,并证明了对于最佳臂的总损失或损失的二次变化的上界是接近紧的。此外,研究还证明了两个不可能的结果,即单臂最优和遗憾不能随损失范围的提高而扩展。相比之下,在完全信息设置中这两个结果是可能的。
- 符号排名与 VC 维度
该研究研究了给定 VC 维度下 $N imes N$ 符号矩阵的最大符号秩。通过概率构造得到下界,使用 Welzl 的结果和 moment curve 得到上界。还展示了符号秩和谱差之间的一般联系,并描述了与通信复杂度,几何学,学习理论和 - MM非负随机变量和的二项式、泊松和正态左尾占优
通过研究独立非负随机变量,得出一类非降函数的精确上界以及与此相关的概率分布,进而得出原文所述的特定条件下的指数上界和左尾概率。
- 泛链式下尾部界
我们使用 Talagrand 通用串联方法修改,为随机过程的所有 p 阶矩获得上界。我们将此过程应用于改进和扩展一些已知的偏差不等式,以便获得至上极限的上尾估计,同时具有最佳的偏差参数,其中包括未限制的经验过程和混沌过程的极限值。作为实践, - 组合式预测游戏的极小化策略
我们研究了在线线性优化问题,探讨了半强盗、强盗和完全反馈三种情况下的极小后悔量,并提出了使用 Bregman 投影技术的梯度下降通用策略以及上下界解决方案,并在最后指出了指数加权平均预测者对于 L∞对手是次优解的问题。
- 球装紧上界 I
本文开发了一个线性规划边界的球体装配类比,用于证明并提出球体装配密度的上界,这是至少在 4 到 36 维度上已知的最佳边界,并猜测该方法可用于解决 8 和 24 维度的球体装配问题。