结合多臂老虎机和局部搜索的 MaxSAT 算法
本研究提出了一个名为 BandMaxSAT 的局部搜索算法,它应用多臂赌博机模型来引导搜索方向,特别适用于 Partial MaxSAT (PMS) 和 Weighted PMS (WPMS) 问题,相较于现有算法 SATLike3.0,实验证明 BandMaxSAT 在解决这些问题上更为优秀,与 TT-Open-WBO-Inc 结合可以获得更好的效果。
Jan, 2022
本研究使用 MaxSAT 问题中的 SPB 约束和子句权重技术,提出了一种新的局部搜索算法 SPB-MaxSAT,为 MaxSAT 局部搜索求解器的子句权重方法提供了新的视角和优秀的性能。
Jan, 2024
本文提出了一种名为 FPS 的策略,通过考虑连续翻转一对变量的好处来替换单一翻转机制,以提高本地搜索算法的效率,解决了局部最优解品质较低的问题,并通过最佳取样的方法避免了局部最优解,实验表明该方法极大地提高了最先进的 (W) PMS 解算器的性能。
Aug, 2021
该研究提出了一种基于整数规划和强化学习算法的统一框架 DCSAT,用于解决不同类型的布尔可满足性问题,包括 MaxSAT、Weighted MaxSAT、PMS 和 WPMS 等。通过调整目标函数系数,构建了统一的整数规划表示方法,并基于 0-1 整数规划构建了适当的强化学习模型。基于二叉树搜索结构,在 SAT 问题上应用了蒙特卡罗树搜索(MCTS)方法,证明了该方法能够基于维纳 - 欣钦大数定律找到所有最优的布尔赋值。实验证明,该方法能够剪枝不必要的搜索空间,找到问题的最优布尔赋值,同时为 SAT 问题的监督学习方法提供多样的标签。
Dec, 2023
本研究考虑了一种新颖的多臂赌博机问题(MAB with cost subsidy),为了优化累积的成本和收益,学习机构必须支付选择的手臂成本,针对这种问题,我们提出了探索 - 开发算法的简单版本并对其进行了广泛的数值模拟,最后建立了任何线上学习算法的性能下界,为实际应用不同算法提供了实用性建议。
Nov, 2020
提出了一种解决多人多臂赌博机问题的分布式算法,利用上置信区间和分布式优化技术,解决了现实世界应用中玩家仅能访问动态局部子集的问题,并获得了接近最优的后悔率。
Dec, 2022
通过代数决策图和级联项目 - 加入树生成器,我们提出了动态规划最大可满足性(DPMS),一种解决广义 MaxSAT 问题的新方法。实证结果表明,DPMS 能够快速解决某些问题,由此开辟了未来更多研究的新方向。
May, 2022
本研究提出了第一种无需任何预处理的近似 MIPS 算法,并允许用户控制和限制结果的次优性,该方法将 MIPS 作为最佳 Arm 识别问题,并引入了一种新的赌博问题设置来充分利用 MIPS 的特殊结构,在合成和现实世界数据集上表现优于现有方法。
Dec, 2018
介绍了一种称为带背包的赌徒问题的通用模型,结合了随机整数规划和在线学习的方面。该论文提出了两种算法来解决这个问题,它们的报酬接近于信息论上的最优解,但同时带背包的赌徒问题相比传统的赌徒问题更具挑战性。
May, 2013
讨论了一种无法使用贪心指数算法求解的 Feedback MAB 问题,开发出了一种新颖并且通用的双重算法技术,可为不少于 1+epsilon 的解提供 2+epsilon 的近似值,这个技术同样适用于其他不特定的喧闹强盗问题和 POMDP。
Nov, 2007