Nov, 2023

针对健康行为改变的自适应干预

TL;DR通过改进的Thompson采样算法实现对个性化目标的优化和个性化奖励函数的最优化,从而在移动健康应用中达到降低累积遗憾和提高个性化回报的效果。