Sep, 2024

预算约束下的在线决策延迟

TL;DR本研究解决了在预算限制下,机器学习模型在连续任务中如何适应变化的决策情况的问题。通过提出一种上下文赌博机模型,该方法在理论上保证了适应性,并展示了在现实数据集上的显著性能提升。研究结果表明,能够有效减轻专家决策负担并提高自动决策的可靠性。