Aug, 2023

二人强化学习

TL;DR本文介绍了一种基于上下文因素和目标人以及他们的照顾伙伴的过去反应的在线强化学习算法-双人强化学习,旨在个性化干预传递,提高社会支持。通过在玩具场景和移动健康研究中收集的实际数据的模拟研究,我们展示了双人强化学习的实证绩效。