脑机接口中的多臂赌博机
本文针对多臂赌博机问题中存在的多元反馈进行研究,通过使用广义Gini指数聚合函数对多目标在线优化问题进行形式化,并提出了一种在线梯度下降算法来解决该问题。该算法利用GGI聚合函数的凸性,通过精心控制探索来实现分布自由的回归。在合成数据和电池控制问题上进行测试,可以有效地平衡不同细胞的退化速率。
Jun, 2017
本文研究使用复合和匿名反馈的多臂老虎机问题,提出适应性算法,解决了没有先验关于奖励间隔大小的信息的问题,并且进行了基于真实数据集的模拟实验,结果表明我们的算法胜过现有的基准算法。
Dec, 2020
本研究通过优化分布式算法中奖励的传递来解决通信瓶颈问题,并提出了一种新的基于泛化奖励量化算法QuBan的通信高效的多臂老虎机算法,该算法只需要每次发送3位比特就可以保持与传统算法相同的后悔限制。
Nov, 2021
本论文研究了一种称为图赌博机的多臂赌博机扩展问题,提出了一种能够利用乐观原则平衡长期探索与开发的学习算法G-UCB,并证明其能够达到理论最优的遗憾界,数值实验结果表明该算法优于其他基准算法。
Sep, 2022
采用先前任务学习得到的先验知识,我们提出了一种串联的前两名Thompson抽样算法(Sequential Top-two Thompson Sampling, STTS),将广义多臂老虎机中的最佳臂序列问题视为一系列任务。这种算法取得了实质性的实验性改进。
May, 2023
设计一种不使用奖励分布信息的多臂赌博机算法,通过交替应用贪婪规则与强制探索来实现显著的后悔上界,并提供不同强制探索策略下的问题依赖性后悔上界分析方法,适用于不同奖励分布的固定和分段固定设置。
Dec, 2023
本综述论文提供了应用于脑机接口的可解释人工智能技术的整合视角。对大脑信号进行解释的预测模型在各种高风险应用中使用。然而,在这些复杂模型中实现可解释性是具有挑战性的,因为这会损害准确性。为了解决脑机接口的可解释性需求,提出了可解释人工智能为脑机接口的综合框架 (XAI4BCI) 的文献缺乏整合视角的问题。该研究通过系统性回顾和元分析提出了六个关键的研究问题,涵盖了XAI在脑机接口的目的、应用、可用性和技术可行性方面。本研究结果强调当前研究主要集中在解释性方面,旨在为开发人员和研究人员提供成果的解释并增强模型性能。研究还从哲学、心理学和社会科学中获取了独特的方法、优势和限制。同时,提出了一种面向 XAI4BCI 的设计空间,考虑到为脑机接口发展和部署生命周期中的各利益相关方定制可视化和研究预测模型结果的不断需求。本论文是第一篇仅专注于回顾 XAI4BCI 研究文章的论文。该系统性回顾和元分析结果与提出的设计空间引发了关于建立BCI解释标准的重要讨论,并突出了当前的局限性,指导了XAI在BCI领域的未来发展。
Dec, 2023
本研究解决了现有智能辅导系统缺乏开源多臂强盗(MAB)算法的问题,提出了一种可简单部署的分层MAB算法,能够同时引导学生学习不同难度的概念和问题,并评估记忆衰退。实验结果表明,该算法显著提高了学生的成功率,且问题难度适应的进一步增强了这一效果。
Aug, 2024