关键词multi-armed bandit settings
搜索结果 - 2
- KDD多臂赌博机中的通用异常值检测
本文研究在多臂老虎机中检测异常臂的问题,并提出了一个名为 GOLD 的新型拉动算法,通过实时构建邻域图形的方式实现对可能存在的异常臂的鲁棒识别,实验结果表明该算法相对于最先进的技术可平均节省 83%的探索成本,并在准确性上达到了 98%的表 - ICML受托机构强盗
本文介绍了一种新的推荐系统模型,其面临探索 - 开发折衷,并可以被建模为多臂老虎机设置,由于用户具有自利性质,因此不能被强制性遵循推荐,作者提出了一种算法以探索为基础,同时考虑到代理人的利益,是一个渐进最优、刺激兼容、先验个体理性的推荐算法