ICMLFeb, 2023

在线持续上下文推荐系统超参数优化

TL;DR本文提出了第一个在线连续超参数调整框架,即 CDT 框架,用于学习最佳超参数配置,可以在不预设候选超参数组合的情况下调整上下文 bandit 算法,其中使用 Zooming TS 算法进行探索和重启技术来避免环境切换,并提供更好的实验结果。