Aug, 2022

在线强化学习算法口腔自我护理支持中的奖励设计

TL;DR本文开发了基于强化学习的算法,用于优化移动提示的发送,以鼓励口腔自我护理行为。研究致力于解决算法中的延迟效应问题,通过设计质量奖励并优化超参数选择,最终被部署在提供行为策略以提高口腔健康的 Oralytics 应用程序上。