- 基于数据驱动的上界置信度在重尾赌博机上的近优遗憾
本文提出了一种分布无关、数据驱动的上置信界(UCB)算法,结合最近发展的重新抽样中位数法(RMM)方法,对称奖励分布的研究中生成近乎最优的后悔边界,即使是重尾分布。
- 使用 Wasserstein - 邻近正规化的 $α$- 散度学习重尾分布
我们提出了 Wasserstein proximals of $\alpha$-divergences 作为学习重尾分布的合适目标函数,首先给出了数据维度、$\alpha$ 和数据分布衰减率之间的足够关系以及某些情况下的必要关系,使得 Wa - 重尾臂赌博机中实现全自适应遗憾最小化
学习重尾分布下的遗憾最小化问题,引入自适应算法并提供适应性鲁棒 UCB 方法,以最小化重尾 MAB 问题的遗憾。
- 面向重尾奖励的可证明鲁棒时序差分学习
本文探讨了强化学习中,奖励分布呈现重尾分布时,采用动态梯度裁剪机制的 TD 学习和 NAC 方法能够应对此类问题,论证了采用动态梯度裁剪机制的 TD 学习可在偏置和随机梯度变化之间实现有利的权衡,对于一些 p(0<p<=1),都以期望和高的 - 在线重尾变点检测
本文研究了在线变点检测算法,提出了基于剪切随机梯度下降的算法,可以在只假设数据生成过程的第二矩有界的情况下工作,并使用联合边界论证形成具有有限样本假阳性率保证的顺序变点算法,可在各种情况下成功检测到概率密度分布的变化。
- 量子厚尾赌博机
本文研究了具有重尾分布的奖励和量子奖励谷歌的多臂黑客(MAB)和随机线性黑客(SLB)。
- 基于尾风险度量的最优臂识别方法
本论文提出了一种基于多臂赌博机算法的方法,用于识别在金融行业和不确定环境中具有最小条件风险价值、价值风险价值或条件风险价值加权平均的多臂赌博机,其主要贡献是一种能够适用于包括重尾分布在内的一般分布上的最优算法,匹配了样本所需的预期数量下界, - 重尾梯度噪声下随机梯度下降的首次退出时间分析
本研究提出了一种新的视角来分析随机梯度下降,即将其作为一阶随机微分方程(SDE)的离散化,进而推导出了使得离散化后的系统与连续时间系统行为相似的步长条件,并分析了算法和问题参数对误差的影响。
- 基于乐观主义的线性二次系统自适应调节
本文针对线性二次系统的自适应控制过程中参数辨识与控制权衡的问题,提出了一种基于乐观偏置优化(optimism-based)的自适应控制方法。通过采用一些新的技术手段,本文对于重尾分布的随机矩阵的概率行为进行了综合处理,证明了该方法在半末态下 - 自适应 Huber 回归
本篇论文提出了一种针对大数据中的尾部离群值和重尾分布等问题的自适应 Huber 回归方法,其中关键观察是,用于鲁棒性参数自适应的最优偏差和鲁棒性之间的权衡应该适应于样本大小,维度和矩。
- 使用 Alpha 稳定卷积稀疏编码学习脑信号形态学
本研究提出了一种基于概率卷积稀疏编码的模型,使用 alpha-stable 分布来学习神经信号中的平移不变原子,并提出了一种计算效率高的 Monte Carlo 期望最大化算法,该算法对噪声等干扰信号具有较强的鲁棒性。
- 高维鲁棒 M 估计量的统计一致性和渐近正态性
在处理高维稀疏线性模型、有重尾分布和 / 或异常点污染的数据时,研究正则化鲁棒 M - 估计量的理论性质,首先在错误分布满足一定条件时建立一种罚函数回归估计器的局部统计一致性形式,并在这种条件下证明了这些估计器的极小化误差达到了 Lasso - NIPS线性模型中的多变量重尾推断
提出了一种基于特征函数的线性特征模型(LCM),利用稳定分布计算在图形模型中存在的重尾分布下的精确和近似推理,该模型不局限于稳定分布,并可适用于离散、连续或混合随机变量。