Dec, 2023
交互式机器学习系统中对多样用户进行服务初始化
Initializing Services in Interactive ML Systems for Diverse Users
Avinandan Bose, Mihaela Curmei, Daniel L. Jiang, Jamie Morgenstern, Sarah Dean...
TL;DR该研究旨在研究与用户交互学习的机器学习系统,以提供不同用户群体的专门化服务,并预测用户偏好;通过采用针对性的方法,克服了未知用户偏好和次优本地解决方案的挑战。
Abstract
This paper studies ml systems that interactively learn from users across
multiple subpopulations with heterogeneous data distributions. The primary
objective is to provide specialized services for different user groups while
also predicting →
ml systemsuser preferencesiterative learning dynamicsunknown user preferencessuboptimal local solutions
发现论文,激发创造
当用户选择时从流式数据中学习
在由许多竞争服务组成的数字市场中,用户根据自己的偏好在多个服务提供商之间进行选择,所选择的服务利用用户数据来逐步改进其模型。服务提供商的模型影响用户在下一个时间步选择的服务,而用户的选择反过来又影响模型更新,从而形成了一个反馈循环。本文对上述动态进行了形式化,并开发了一个简单高效的分散算法来在本地最小化总体用户损失。理论上,我们证明了我们的算法渐近收敛到整体损失的稳定点。我们还通过真实世界数据实验证明了我们算法的实用性。
Jun, 2024
多学习者环境中的战略使用
现实世界的系统中,用户在一组服务中进行选择,通过在线学习算法,这些服务可以自我优化并最大化一些回报,而用户可以策略性地选择服务以追求他们自己的回报函数,我们分析了一个策略性用户在多个可用的服务中进行选择的情境,并研究了损失函数在这种情境下的收敛行为。
Jan, 2024
无监督模型个性化保护隐私和可扩展性:一个开放性问题
本文研究了无监督模型个性化任务,提出了一个新的 Dual User-Adaptation 框架,通过服务器端模型个性化和用户设备上的本地数据正则化,实现了可伸缩性和本地数据隐私保护的用户自适应模型。
Mar, 2020
鲁棒交互式学习的通用框架
提出了一种基于 Angluin 等人的等效查询模型和 Littlestone 的在线学习模型的交互式学习模型的一般框架,旨在利用少数迭代来学习地面真实模型,该模型基于图表示和用户反馈,但是这不一定要求相应的权重在信息安全的环境下 100% 正确。
Oct, 2017
大型语言模型对齐的多样化偏好
通过混合不同的人类偏好数据集以增加数据量来增强奖励建模的方法可能失败,因此该研究提出了一种名为 MORE 的新的训练策略,通过自适应调整偏好目标来捕捉不同偏好中的共享人类价值观,实验证明 MORE 相较于其他方法在奖励准确性和校准误差方面有更好的表现。
Dec, 2023