Feb, 2024

具有未知延迟的在线顺序决策

TL;DR在在线顺序决策的领域中,我们利用在线凸优化(OCO)框架解决带有延迟的问题,其中决策的反馈可能会有未知的延迟。我们提出了三类基于近似解的延迟算法,以处理不同类型的接收反馈。我们提出的算法多功能且适用于通用范数,在每种算法类型下给出了相应的遗憾界限。我们通过具体示例展示了每种算法在不同范数下的效率,并且理论结果在标准设置下与当前最佳界限一致。