Apr, 2024

大规模推荐系统中的缓存感知强化学习

TL;DR本文提出了一种缓存感知的强化学习方法(CARL),通过实时计算和缓存的联合优化来改善用户参与度,并通过实验表明 CARL 在考虑结果缓存时能显著提高用户参与度。CARL 已在快手应用完全推出,并服务于超过一亿用户。