linear stochastic bandits | BriefGPT

关键词linear stochastic bandits

搜索结果 - 5

多对数级别的极小极大遗憾的线性赌博机
研究线性随机赌博机的噪声模型，介绍一种基于加权最小二乘估计的算法，能够最小化后悔度，通过几何论证独立于噪声模型，能够紧密控制每个时间步骤的期望后悔度为 O (1/t)，从而导致了累积后悔度的对数缩放。
PDF5 months ago
具有线性功能逼近的重尾奖励方差感知健壮增强学习
该论文提出了两个算法 - AdaOFUL 和 VARA，以解决在有限方差的重尾回报情况下的在线顺序决策问题。这些算法可以应用于线性随机赌博机和线性马尔可夫决策过程，并且新的算法优于之前的算法。其中 AdaOFUL 和算法 Huber 回归适
PDFa year ago
ICML线性随机臂何时易受攻击？
本文探讨了对线性随机赌博机的对抗攻击，提供了攻击性的充分必要条件，针对 LinUCB 和 Robust Phase Elimination 方法提出了一种有效的攻击方法并得出了数字实验结果。
PDF3 years ago
ICML线性赌博机探索的游戏化
研究了线性随机机器人中的最佳臂标识，在标准多胳臂机器人中存在渐近最优算法，但是对于线性机器人中的最佳臂识别还没有出现这样的算法，本文提出了一种渐近最优算法。
PDF4 years ago
具有重尾收益的线性随机赌博机的几乎最优算法
本研究提出一种创新的算法来解决具有重尾收益的线性随机赌博机问题，并证明了算法的最优性。
PDF6 years ago