结合多臂老虎机和局部搜索的 MaxSAT 算法

Nov, 2022

结合多臂老虎机和局部搜索的 MaxSAT 算法

Incorporating Multi-armed Bandit with Local Search for MaxSAT

Jiongzhi Zheng, Kun He, Jianrong Zhou, Yan Jin, Chu-Min Li...

TL;DR本文提出了一种基于多臂赌博机的本地搜索算法 BandHS 用来解决 MaxSAT 及其两个泛化问题，和一个初始化方法优化算法的表现。经过大量实验证明，本文提出的方法在解决 MaxSAT 问题时表现出色。

Abstract

Partial maxsat (PMS) and Weighted PMS (WPMS) are two practical generalizations of the maxsat problem. In this paper, we propose a local search

maxsat local search multi-armed bandits soft clauses hard clauses

发现论文，激发创造

BandMaxSAT：具有多臂老虎机的局部搜索 MaxSAT 求解器

本研究提出了一个名为 BandMaxSAT 的局部搜索算法，它应用多臂赌博机模型来引导搜索方向，特别适用于 Partial MaxSAT (PMS) 和 Weighted PMS (WPMS) 问题，相较于现有算法 SATLike3.0，实验证明 BandMaxSAT 在解决这些问题上更为优秀，与 TT-Open-WBO-Inc 结合可以获得更好的效果。

Jan, 2022

重新思考 MaxSAT 局部搜索求解器中的软冲突伪布尔约束

本研究使用 MaxSAT 问题中的 SPB 约束和子句权重技术，提出了一种新的局部搜索算法 SPB-MaxSAT，为 MaxSAT 局部搜索求解器的子句权重方法提供了新的视角和优秀的性能。

Jan, 2024

利用远见概率采样提升本地搜索 MaxSAT 求解器的通用策略

本文提出了一种名为 FPS 的策略，通过考虑连续翻转一对变量的好处来替换单一翻转机制，以提高本地搜索算法的效率，解决了局部最优解品质较低的问题，并通过最佳取样的方法避免了局部最优解，实验表明该方法极大地提高了最先进的 (W) PMS 解算器的性能。

Aug, 2021

解决四类 SAT 问题的通用方法

该研究提出了一种基于整数规划和强化学习算法的统一框架 DCSAT，用于解决不同类型的布尔可满足性问题，包括 MaxSAT、Weighted MaxSAT、PMS 和 WPMS 等。通过调整目标函数系数，构建了统一的整数规划表示方法，并基于 0-1 整数规划构建了适当的强化学习模型。基于二叉树搜索结构，在 SAT 问题上应用了蒙特卡罗树搜索（MCTS）方法，证明了该方法能够基于维纳 - 欣钦大数定律找到所有最优的布尔赋值。实验证明，该方法能够剪枝不必要的搜索空间，找到问题的最优布尔赋值，同时为 SAT 问题的监督学习方法提供多样的标签。

Dec, 2023

成本补贴的多臂老虎机

本研究考虑了一种新颖的多臂赌博机问题（MAB with cost subsidy），为了优化累积的成本和收益，学习机构必须支付选择的手臂成本，针对这种问题，我们提出了探索 - 开发算法的简单版本并对其进行了广泛的数值模拟，最后建立了任何线上学习算法的性能下界，为实际应用不同算法提供了实用性建议。

Nov, 2020

分散式随机多人多臂行走赌博机

提出了一种解决多人多臂赌博机问题的分布式算法，利用上置信区间和分布式优化技术，解决了现实世界应用中玩家仅能访问动态局部子集的问题，并获得了接近最优的后悔率。

Dec, 2022

DPMS：基于 ADD 的符号化方法解决广义 MaxSAT 问题

通过代数决策图和级联项目 - 加入树生成器，我们提出了动态规划最大可满足性（DPMS），一种解决广义 MaxSAT 问题的新方法。实证结果表明，DPMS 能够快速解决某些问题，由此开辟了未来更多研究的新方向。

May, 2022

一种用于最大内积搜索的贝叶斯赌博算法

本研究提出了第一种无需任何预处理的近似 MIPS 算法，并允许用户控制和限制结果的次优性，该方法将 MIPS 作为最佳 Arm 识别问题，并引入了一种新的赌博问题设置来充分利用 MIPS 的特殊结构，在合成和现实世界数据集上表现优于现有方法。

Dec, 2018

带背包的赌博机

介绍了一种称为带背包的赌徒问题的通用模型，结合了随机整数规划和在线学习的方面。该论文提出了两种算法来解决这个问题，它们的报酬接近于信息论上的最优解，但同时带背包的赌徒问题相比传统的赌徒问题更具挑战性。

May, 2013

不静态赌博机问题的近似算法

讨论了一种无法使用贪心指数算法求解的 Feedback MAB 问题，开发出了一种新颖并且通用的双重算法技术，可为不少于 1+epsilon 的解提供 2+epsilon 的近似值，这个技术同样适用于其他不特定的喧闹强盗问题和 POMDP。

Nov, 2007