May, 2023
稀疏线性动态单臂赌博问题的协作阈值套索算法
Cooperative Thresholded Lasso for Sparse Linear Bandit
Haniyeh Barghi, Xiaotong Cheng, Setareh Maghsudi
TL;DR本文提出了一种用于解决多智能体稀疏背景下的上下文线性赌博问题的新方法,通过使用 Lasso 回归进行维度缩减、回归进行问题解决、结合特定过程和网络结构共享信息,达到降低通信成本、保证最小累计遗憾值的效果,并在合成和真实场景下验证了方法的有效性。