ICMLJun, 2024

当用户选择时从流式数据中学习

TL;DR在由许多竞争服务组成的数字市场中,用户根据自己的偏好在多个服务提供商之间进行选择,所选择的服务利用用户数据来逐步改进其模型。服务提供商的模型影响用户在下一个时间步选择的服务,而用户的选择反过来又影响模型更新,从而形成了一个反馈循环。本文对上述动态进行了形式化,并开发了一个简单高效的分散算法来在本地最小化总体用户损失。理论上,我们证明了我们的算法渐近收敛到整体损失的稳定点。我们还通过真实世界数据实验证明了我们算法的实用性。