脑机接口中的多臂赌博机

May, 2022

Multi-Armed Bandits in Brain-Computer Interfaces

Frida Heskebeck, Carolina Bergeling, Bo Bernhardsson

TL;DR本综述介绍了多臂老虎机在脑机接口 (BCI) 中的优化应用，并提出了未来研究方向。

Abstract

The multi-armed bandit (MAB) problem models a decision-maker that optimizes its actions based on current and acquired new knowledge to maximize its reward. This type of online decision is prominent in many procedures of

发现论文，激发创造

武装手臂赌徒

研究了控制组非合规性对多臂老虎机模型的影响，提出了仪器武装贝叶斯问题，并针对该问题开发出新的算法，证明了新算法的效果，并将其与标准多臂老虎机算法进行比较。

May, 2017

多目标赌博机：优化广义基尼系数

本文针对多臂赌博机问题中存在的多元反馈进行研究，通过使用广义Gini指数聚合函数对多目标在线优化问题进行形式化，并提出了一种在线梯度下降算法来解决该问题。该算法利用GGI聚合函数的凸性，通过精心控制探索来实现分布自由的回归。在合成数据和电池控制问题上进行测试，可以有效地平衡不同细胞的退化速率。

Jun, 2017

多臂赌博机与情境赌博机的实际应用调查

该研究详细回顾了多臂赌博框架在各种应用领域上的最新前沿发展，例如推荐系统、信息检索、医疗保健和金融等，同时提供了未来该领域的重要趋势和新视角。

Apr, 2019

复合和匿名反馈多臂赌博机的自适应算法

本文研究使用复合和匿名反馈的多臂老虎机问题，提出适应性算法，解决了没有先验关于奖励间隔大小的信息的问题，并且进行了基于真实数据集的模拟实验，结果表明我们的算法胜过现有的基准算法。

Dec, 2020

使用少量通信解决多臂赌博机问题

本研究通过优化分布式算法中奖励的传递来解决通信瓶颈问题，并提出了一种新的基于泛化奖励量化算法QuBan的通信高效的多臂老虎机算法，该算法只需要每次发送3位比特就可以保持与传统算法相同的后悔限制。

Nov, 2021

基于图的赌博机学习

本论文研究了一种称为图赌博机的多臂赌博机扩展问题，提出了一种能够利用乐观原则平衡长期探索与开发的学习算法G-UCB，并证明其能够达到理论最优的遗憾界，数值实验结果表明该算法优于其他基准算法。

Sep, 2022

基于序列的最优臂识别及其在脑机接口中的应用

采用先前任务学习得到的先验知识，我们提出了一种串联的前两名Thompson抽样算法(Sequential Top-two Thompson Sampling, STTS)，将广义多臂老虎机中的最佳臂序列问题视为一系列任务。这种算法取得了实质性的实验性改进。

May, 2023

强制性探索在赌博问题中的应用

设计一种不使用奖励分布信息的多臂赌博机算法，通过交替应用贪婪规则与强制探索来实现显著的后悔上界，并提供不同强制探索策略下的问题依赖性后悔上界分析方法，适用于不同奖励分布的固定和分段固定设置。

Dec, 2023

可解释的脑-机接口人工智能方法：回顾与设计空间

本综述论文提供了应用于脑机接口的可解释人工智能技术的整合视角。对大脑信号进行解释的预测模型在各种高风险应用中使用。然而，在这些复杂模型中实现可解释性是具有挑战性的，因为这会损害准确性。为了解决脑机接口的可解释性需求，提出了可解释人工智能为脑机接口的综合框架 (XAI4BCI) 的文献缺乏整合视角的问题。该研究通过系统性回顾和元分析提出了六个关键的研究问题，涵盖了XAI在脑机接口的目的、应用、可用性和技术可行性方面。本研究结果强调当前研究主要集中在解释性方面，旨在为开发人员和研究人员提供成果的解释并增强模型性能。研究还从哲学、心理学和社会科学中获取了独特的方法、优势和限制。同时，提出了一种面向 XAI4BCI 的设计空间，考虑到为脑机接口发展和部署生命周期中的各利益相关方定制可视化和研究预测模型结果的不断需求。本论文是第一篇仅专注于回顾 XAI4BCI 研究文章的论文。该系统性回顾和元分析结果与提出的设计空间引发了关于建立BCI解释标准的重要讨论，并突出了当前的局限性，指导了XAI在BCI领域的未来发展。

Dec, 2023

分层多臂强盗算法用于不同难度概念与问题的智能辅导

本研究解决了现有智能辅导系统缺乏开源多臂强盗（MAB）算法的问题，提出了一种可简单部署的分层MAB算法，能够同时引导学生学习不同难度的概念和问题，并评估记忆衰退。实验结果表明，该算法显著提高了学生的成功率，且问题难度适应的进一步增强了这一效果。

Aug, 2024