May, 2024

经纪的情境在线学习理论

TL;DR我们研究了在经纪人之间的在线学习问题中上下文信息的作用。我们假设交易资产的市场价值是代表经纪人可用的上下文信息的$d$维向量的未知线性函数。我们通过与交易利润相关的遗憾来评估学习算法的性能,并提供了相应的遗憾界限。