学习用户偏好以促进共享经济中的探索行为

AAAINov, 2017

学习用户偏好以促进共享经济中的探索行为

Learning User Preferences to Incentivize Exploration in the Sharing Economy

Christoph Hirnschall, Adish Singla, Sebastian Tschiatschek, Andreas Krause

TL;DR通过向用户提供货币奖励来激励他们探索他们可能不会选择的选项是一种有效的方法，使用结构信息模型化为凸约束来学习合适的激励是最佳选择，我们提出了一种新颖的算法 - Coordinated Online Learning（CoOL）用于学习，我们通过测试 Airbnb 上公寓的数据来验证我们的方法是可行的，该方法有助于增加探索。

Abstract

We study platforms in the sharing economy and discuss the need for incentivizing users to explore options that otherwise would not be chosen. For instance, rental platforms such as Airbnb typically rely on custom

sharing economy incentivizing users coordinated online learning structural information monetary incentives

发现论文，激发创造

在线推荐系统中激励高质量内容

本文研究了在线学习算法对内容创作者质量和创作动机的影响，发现 Hedge 和 EXP3 等算法会促进内容低质次，提出了一种基于惩罚低质次内容的算法以激励高质次的内容创作。

Jun, 2023

基于协同学习的在线结构化预测

我们提出了协同学习作为一个学习系统和人类用户之间交互的模型，其共同目标是为用户提供最大的效用结果。我们证明这种反馈可以从可观察的用户行为中推断出来，并且我们展示了在电影推荐任务和 Web 搜索排名任务中协同学习算法的应用。

May, 2012

算法筛选平台上创作者激励建模

该研究探讨了内容创作者为获取用户关注所采取的策略，以及在线平台开发者所做出的算法选择对其影响，并提出了一种名为曝光博弈的模型来形式化这种动态。该模型证明了算法选择对曝光博弈的 Nash 均衡的存在和性质产生了重大影响，并提出了一种针对曝光游戏的 (前置) 审核工具来识别理想内容和以激励为导向的排名之间的不一致情况。

Jun, 2022

创作者经济中的线上学习

本文探讨创作者经济中的在线学习，通过将创作者经济建模为用户、平台和内容创作者之间的三方博弈，分析并比较基于回报和基于特征两类契约，同时优化推荐策略，以期最大化效用。

May, 2023

在推荐系统中插值项目和用户公正性

研究了在线平台中多种利益相关者之间的公平和协调问题，提出一种公平推荐算法来平衡商品销售和用户需求之间的矛盾，并设计了一种低遗憾的在线优化算法，以同时达到商品和用户的公平，最终通过电影数据的案例研究证明了该算法的有效性。

Jun, 2023

联合学习推荐和广告

本文提出了一种新的两级强化学习框架，用于联合优化推荐和广告策略，第一层生成推荐列表以优化用户体验，第二层将广告插入推荐列表以平衡广告客户的即时广告收入和广告对长期用户体验的负面影响。实验结果表明该框架的有效性。

Feb, 2020

当用户选择时从流式数据中学习

在由许多竞争服务组成的数字市场中，用户根据自己的偏好在多个服务提供商之间进行选择，所选择的服务利用用户数据来逐步改进其模型。服务提供商的模型影响用户在下一个时间步选择的服务，而用户的选择反过来又影响模型更新，从而形成了一个反馈循环。本文对上述动态进行了形式化，并开发了一个简单高效的分散算法来在本地最小化总体用户损失。理论上，我们证明了我们的算法渐近收敛到整体损失的稳定点。我们还通过真实世界数据实验证明了我们算法的实用性。

Jun, 2024

基于显式偏好的在线学习和利润最大化

本文研究在在线学习中从揭示的偏好中学习的问题，提出了有效的算法用于商家的价格优化，通过强假设商品收益函数的形式，实现了揭示偏好问题的高效算法，并实现了学习和盈利最大化。

Jul, 2014

竞争环境下探索的危险：一种计算建模方法

通过对探索和竞争之间的相互作用进行实证研究，我们发现：在数字经济中，数据作为进入在线市场的一个障碍，可能促使更好的算法的产生，获得更高的消费者福利；在有竞争的市场中，探索可能会损害系统的声誉，进而降低市场份额，而第一个进入市场的公司则可能促进更好的算法的出现从而提高客户福利。

Feb, 2019

经济平台上 AI 勾结的缓解学习

本文探讨算法定价在电子商务平台上产生的隐性勾结问题，并介绍了设计 ' 购买框 ' 规则来预防勾结定价的方法，同时提出了利用强化学习算法学习有效购买框规则的方法，并通过 Stackelberg POMDPs 方法，成功地制定出在不同销售行为模式和商品成本分布的情况下仍能提供高消费者福利的稳健规则。

Feb, 2022