MMSep, 2020

上下文臂機器人在音樂流媒體應用程式中的旋轉木馬個性化

TL;DR本文针对音乐平台等媒体服务提供商经常使用轮播卡片同用户推荐个性化内容的挑战,将轮播卡片的个性化视为多臂赌博问题,基于级联更新和延迟批量反馈提出了一个框架,并通过实验验证了该框架在全球音乐平台上的可用性。此外,本文公开了实验的工业数据,以及一个开源环境,用于模拟类似的轮播卡片个性化学习问题。