IJCAIApr, 2019
多臂赌博机与情境赌博机的实际应用调查
A Survey on Practical Applications of Multi-Armed and Contextual Bandits
Djallel Bouneffouf, Irina Rish
TL;DR该研究详细回顾了多臂赌博框架在各种应用领域上的最新前沿发展,例如推荐系统、信息检索、医疗保健和金融等,同时提供了未来该领域的重要趋势和新视角。
Abstract
In recent years, multi-armed bandit (MAB) framework has attracted a lot of
attention in various applications, from recommender systems and information
retrieval to →
发现论文,激发创造
多人赌博机问题再探
本文探讨了多层次反馈的多人多臂老虎机算法,并在不需要感知信息的情况下引入了一种被称为自私的有希望的启发式方法以适应与物联网网络的应用。研究结果显示,引入这些方法可以提高算法的性能并保证其渐近最优,降低拥堵的可能性。
Nov, 2017
成本补贴的多臂老虎机
本研究考虑了一种新颖的多臂赌博机问题(MAB with cost subsidy),为了优化累积的成本和收益,学习机构必须支付选择的手臂成本,针对这种问题,我们提出了探索 - 开发算法的简单版本并对其进行了广泛的数值模拟,最后建立了任何线上学习算法的性能下界,为实际应用不同算法提供了实用性建议。
Nov, 2020
多臂赌博机简介
这篇论文介绍了多臂老虎机模型及其在不确定情况下做出决策的算法框架,在这一框架下,研究者们已经做出了大量的工作,本书提供了一种入门级的介绍,包括从基础模型到贝叶斯先验;从固定概率分布到可观测环境,通过与经济学的联系进行论述,使得读者可以更好地理解这个理论框架的应用。
Apr, 2019
多臂老虎机模型在临床试验最优设计中的应用:优势与挑战
本研究使用多臂赌博问题 (Multi-armed bandit problems, MABPs) 来探索在临床试验中优化设计和资源分配的理论,比较不同的分配规则,提出一种新的患者分配规则以克服低统计功效的问题,并为临床试验的实际设计和分析提供理论参考。
Jul, 2015
推荐系统中的赌博算法现场测试:理解多臂赌博机对人类偏好假设的有效性
本文探究并验证基于多臂赌博机算法 (MABs) 生成的个性化推荐系统所依赖的假设是否正确,结果表明人类偏好动态性的存在需要被考虑。同时,作者还提供了一种灵活的实验框架来理解人类偏好动态性和测试 MABs 算法。
Apr, 2023