当用户选择时从流式数据中学习

ICMLJun, 2024

Learning from Streaming Data when Users Choose

Jinyan Su, Sarah Dean

TL;DR在由许多竞争服务组成的数字市场中，用户根据自己的偏好在多个服务提供商之间进行选择，所选择的服务利用用户数据来逐步改进其模型。服务提供商的模型影响用户在下一个时间步选择的服务，而用户的选择反过来又影响模型更新，从而形成了一个反馈循环。本文对上述动态进行了形式化，并开发了一个简单高效的分散算法来在本地最小化总体用户损失。理论上，我们证明了我们的算法渐近收敛到整体损失的稳定点。我们还通过真实世界数据实验证明了我们算法的实用性。

Abstract

In digital markets comprised of many competing services, each user chooses between multiple service providers according to their preferences, and the chosen service makes use of the →

digital markets competing services user data decentralized algorithm overall user loss

发现论文，激发创造

交互式机器学习系统中对多样用户进行服务初始化

该研究旨在研究与用户交互学习的机器学习系统，以提供不同用户群体的专门化服务，并预测用户偏好；通过采用针对性的方法，克服了未知用户偏好和次优本地解决方案的挑战。

Dec, 2023

推荐系统与人的交互

该研究旨在了解推荐算法对未来用户数据的影响，通过提出一个简单模型，表明忽略这个反馈循环将导致非一致性评估器，因此验证了我们的结论。

Mar, 2017

第四届在线推荐系统和用户建模研讨会论文集 -- ORSUM 2021

探索在线服务的动态特性，通过增量算法在数据流中进行用户建模和个性化推荐。

Jan, 2022

多学习者环境中的战略使用

现实世界的系统中，用户在一组服务中进行选择，通过在线学习算法，这些服务可以自我优化并最大化一些回报，而用户可以策略性地选择服务以追求他们自己的回报函数，我们分析了一个策略性用户在多个可用的服务中进行选择的情境，并研究了损失函数在这种情境下的收敛行为。

Jan, 2024

交易数据以学习：设备联邦学习的激励机制

采用博弈论设计一种有效的激励机制来解决联邦学习中用户参与之间的难题，同时解决由于学习过程中隐私泄露而导致的效果下降问题。

Sep, 2020

规模鲁棒的及时异步分散式学习

分布式异步学习系统通过模型更新和模型混合过程实现用户模型在有限时间内的收敛，并证明了当网络规模很大时，具有对数规模的用户混合能够保证用户模型的收敛，而有界的陈旧度只能通过至少与用户数量成线性关系的分布式机会方案来保证。

Apr, 2024

基于结构匹配市场的去中心化、无需通信和协调的学习

在双边撮合市场中，我们研究了竞争环境下在线学习的问题，如一方的代理人必须通过重复互动了解对另一方的企业的偏好，并与其他代理人竞争成功匹配。我们提出了一类分散、不需要协调的算法，代理人可以使用该算法在结构化匹配市场中达到稳定匹配，其决策仅基于代理人自己的游戏历史，不需要预先了解企业的偏好。研究表明，在代理人和企业的底层偏好具有现实结构假设的情况下，所提出的算法在时间范围内具有最多对数增加的后悔成本。在匹配市场的情况下，我们的结果表明，竞争不会极大地影响分散、不需要通信和协调的在线学习算法的性能。

Jun, 2022

流式推荐系统

本文提出 sRec 框架，使用变分贝叶斯方法来处理流式推荐系统数据，并在真实数据集上的实验结果表明其优于其他流推荐系统的算法。

Jul, 2016

数据反馈环路：基于模型驱动的数据集偏差放大

本文旨在通过记录模型与数据的交互过程，以改善未来爬取的 Internet 数据集的信息稳定性。我们发现模型输出表现为源自训练集的样本具有一致性校准时，偏见放大的程度与模型预测的性别偏差等测试时偏差统计显著相关，如果同时在三个条件预测场景中使用，能更好的校准和稳固反馈系统。

Sep, 2022

学习增强的在线时间信息和传输成本最小化

考虑到离散时间系统中的资源受限源，通过时变无线信道将其时间敏感的数据传输到目的地。我们开发了一种鲁棒的在线算法，以最小化传输和信息老化成本之和，确保最坏情况下的性能保证。

Mar, 2024