BriefGPT.xyz
Ask
alpha
关键词
online experimentation
搜索结果 - 4
具有网络干扰的多臂赌博机
通过研究在线干预实验中的干扰问题,我们提出了基于线性回归算法的多臂赌博机策略,以最小化后悔并实现低后悔的任务分配。
PDF
a month ago
在线实验中持续时间推荐的效应大小估计:利用层次模型和客观效用方法
基于数据驱动的在线实验,提出了两种方法:使用考虑实验差异性的三层高斯混合模型来估计期望效应大小,以及基于效用理论来确定最佳效应大小,通过与基准方法的比较,表明了这些方法的卓越性能。
PDF
7 months ago
帕累托最优代理指标
论文提出 Pareto 最优代理指标方法,该方法同时优化了预测精度和灵敏度,并给出了一种有效的多目标优化算法用于实验评估和决策,大幅提高了工业推荐系统启动新功能的决策速度和质量。
PDF
a year ago
通过贝叶斯赌博算法在线评估定向广告受众
该论文介绍了一种在分割目标受众群体并在线实验中解决数字广告匹配问题的上下文强化学习算法,并在中国电商平台 JD.com 上实现
PDF
5 years ago
Prev
Next