关键词stochastic linear bandit problem
搜索结果 - 4
- 利用鞍点边界来改进随机线性赌臂算法的新算法
我们提出了一种改进的算法,可保证在最坏情况下减少后悔,以解决随机线性强盗问题。
- 鲁棒和差分隐私随机线性赌博机
本研究使用对数批量查询和不同的隐私模型提出不同关于武断攻击的差分隐私和鲁棒性阿姆淘汰算法,实现同时在随机线性医生问题中提供差分隐私和对手强度的功能,并提供相应的遗憾界限。
- 抗对抗攻击的随机线性臂机算法
研究了随机线性赌博机问题,考虑了对抗攻击,提出了两种 Robust Phased Elimination 算法,证明了在非污染情况下可以获得近似最优的收益,并得出针对这些算法的相对近似最优的加性项。同时,在具有多样化情境的情况下,表明一种简 - 结构化随机线性 Bandits
研究如何在处理具有结构属性的未知参数(例如稀疏、分组稀疏、低秩)的随机线性 Bandit 问题中构建置信椭圆,以达到更紧密的置信度范围和更尖锐的失误边界。