- 基于随机已知日志的符合性检查
本文提出了一种基于随机过程观察的过程挖掘和确认方法,使用概率数据分类模型和算法来比较一个过程模型和事件日志,以发现最优匹配。
- 通过离线神谕在具有多个类别的情境下选择最优模型的方法
本研究提出了一种新的算法,用于解决上下文 Bandit 问题中的模型选择问题,该算法通过离线模型选择预言机的方式平衡偏差 - 方差交换和探索 - 利用交换,并具有与回归模型选择相同的计算要求。
- 稀疏线性赌博机的信息引导采样
本文提出了一种基于信息定向抽样 (IDS) 的信息论贝叶斯遗憾界,在计算上能够高效地实现稀疏 IDS,通过数值实验表明相对于几个基线算法,稀疏 IDS 有明显的遗憾减少。
- ICML带有变分 Wishart 扩散的随机微分方程
本文提出了一种贝叶斯非参数推断随机微分方程的方法,该方法可用于回归任务和连续时间动态建模,强调微分方程的随机部分,利用 Wishart 过程对其进行建模,同时提出了半参数化方法,可以应用于高维模型的建模,成功地模型化了具有条件异方差噪声的潜 - 单次随机额外梯度方法的收敛性
本文介绍了一种名为 Extra-Gradient 算法的方法,通过仅使用一个 oracle 调用每个迭代来代替额外的梯度步骤,是深度学习应用中极具潜力的方法,证明了它们在解决光滑、确定性问题的同时仍然保持了 O (1/t) 的收敛速度,并且 - 阻断赌徒
考虑到重复使用某些选项可能是不可取的或不可行的,本文提出了一种新颖的随机多臂赌博机设置,并通过映射到 PINWHEEL 调度问题证明了问题的优化累积奖励不允许有伪多项式时间算法,但它设计了一种贪婪算法和一种基于 UCB 的算法,具有一定的优 - IJCAI零阶随机交替方向乘子法用于非凸非光滑优化
本文提出了一种基于坐标平滑梯度估计器的快速零阶随机 ADMM 方法(即 ZO-SVRG-ADMM 和 ZO-SAGA-ADMM),用于解决具有多个非光滑惩罚的非凸问题,证明了这两种方法的收敛速率为 $O(1 / T)$,可以有效地解决许多复 - 超越反向传播:使用辅助变量的在线交替极小化
本研究提出了一种新的在线 (ALternating Minimization) 方法来训练深度神经网络,同时也给出了该方法在随机设置下的理论收敛保证,并在不同体系结构和数据集上展示出具有前景的实证结果。
- 关于突发性和缓慢变化的多臂赌博问题
LM-DSEE 与 SW-UCB# 两种算法解决了非稳态随机多臂赌博问题,在突变和缓慢变化的环境下,这些算法在时间上的预期总遗憾被控制在时间的子线性函数上。
- 随机低秩赌博机
本文提出了一种名为 LowRankElim 的算法,该算法能够在一定时间复杂度下对一个非负矩阵寻找其的最大值,并且在文献中该类结果首次出现。
- 具有多次游戏和预算限制的多臂赌博机
研究多臂赌博问题下的多次试验和预算约束的拓展,提出上置信区间和 Exp3 算法的具体实现及其性能分析。
- 随机变分视频预测
本文的目的在于提出一种名为 SV2P 的模型,该模型在真实世界的视频数据中获得了可靠的、有多个可行未来的预测结果,相比于传统的视频预测模型,我们的模型明显提升了预测效果。
- ICML带有延迟、汇聚匿名反馈的赌博机
研究了一种带有延迟的聚合匿名反馈的赌博机问题,表明在期望延迟已知的情况下,可以通过提供的算法,在硬的、延迟聚合匿名反馈设置中维持类似于非匿名问题的后悔成本,但在延迟不确定情况下,增加了对数因子或加性方差项的后悔成本。
- MMGigamachine: 桌面计算机上的增量机器学习
本研究提出一种适用于桌面计算机的 Solomonoff 增量机器学习系统设计,使用 R5RS 方案作为参考机器,引入基于随机上下文无关文法的 Levin 搜索变种及新的更新算法,涉及生产概率调整、前期概率分布扩展等技术,并讨论其扩展和引导借 - Augmentor: 用于机器学习的图像增强库
Augmentor 是一个 Python 和 Julia 版本的软件包,使用基于管道的随机方法对现有观察数据进行数据增强,并提供大量常用机器学习数据增强任务的助手函数和多种高级特性。
- 线性系统的随机重构方法:算法和收敛理论
本文提出一种基于用户定义参数(矩阵和概率分布)的随机问题,它具有等价的解释方式,能够转化为最优化问题、线性系统、不动点问题和概率交点问题,并提出了三种具有全局线性收敛率的随机算法来解决问题,这些方法可以被理解为随机梯度下降、随机牛顿法、随机 - 收敛速度为 O(1/n)的随机组合最小二乘回归
考虑由二次函数的期望值和任意凸函数组合成的复合目标函数的最小化问题,我们研究了随机双均值算法在恒定步长下的特性,证明其无需强凸假设即可获得 O (1/n) 的收敛速度,从而将欧几里得几何中关于最小二乘回归的较早结果扩展到了 (a) 所有凸正 - NIPS有限数值精度的循环神经网络
本研究着眼于 RNN 模型的计算资源需求问题,提出了一种通过降低权重与偏置数值精度的方法来优化模型计算的解决方案,并在两种主要的 RNN 模型及三个数据集上进行了实验,结果表明使用随机和确定性三值化、pow2 - 三值化和指数量化方法均能生 - 渐进式方差缩减随机优化的非凸稀疏学习
我们提出了一种基于随机方差减少优化算法的稀疏学习问题求解方法,该方法在满足一定条件下具有线性收敛保证和高维度下的最优估计精度。我们进一步将该算法扩展到一种异步并行版本,具有近似线性加速。数值实验表明,我们的算法在参数估计和计算性能方面都具有 - 上下文多臂赌博机调查
该研究综述了几种随机和对抗性的上下文 Bandit 算法,分析了每个算法的假设和遗憾界。