Jun, 2022

数字干预强化学习算法设计:实施前指南

TL;DR该研究介绍了如何使用预测性、可计算性和稳定性(PCS)框架设计在线强化学习算法来个性化数字干预,提供了指南并展示了如何在模拟环境中评估候选算法,以加强现实时间限制和用户动态环境的稳定性,从而在 Oralytics 项目中改善用户的口腔健康,预计 2022 年底进行实地测试。