Aug, 2022
在线强化学习算法口腔自我护理支持中的奖励设计
Reward Design For An Online Reinforcement Learning Algorithm Supporting Oral Self-Care
Anna L. Trella, Kelly W. Zhang, Inbal Nahum-Shani, Vivek Shetty, Finale Doshi-Velez...
TL;DR本文开发了基于强化学习的算法,用于优化移动提示的发送,以鼓励口腔自我护理行为。研究致力于解决算法中的延迟效应问题,通过设计质量奖励并优化超参数选择,最终被部署在提供行为策略以提高口腔健康的 Oralytics 应用程序上。