Jun, 2020

多标准多臂老虎机的有约束遗憾最小化

TL;DR本研究提出一种叫做Con-LCB的算法,针对多维度、可能存在冲突评估指标的情况下,通过样本估算较优的“主要”指标,并且在满足“次要”指标的约束条件下,优化该主要指标,同时保证该算法的普适性和最优性,且在金融组合优化等应用领域也具有意义。