Feb, 2024

成本感知的最佳臂识别

TL;DR该研究针对具有双重对象的最佳臂辨识问题进行了研究。在传统奖励的基础上,每个臂都与成本分布相关联,目标是通过最小的预期成本来辨识出最高奖励的臂。研究提出了一个理论下界和两种算法,以降低计算复杂性和实现近乎最优的性能。通过实验证明了忽视异质性行动成本会导致亚最优解,并且低复杂性算法在广泛的问题范围内提供近乎最优的性能。