创作者经济中的线上学习

May, 2023

Online Learning in a Creator Economy

Banghua Zhu, Sai Praneeth Karimireddy, Jiantao Jiao, Michael I. Jordan

TL;DR本文探讨创作者经济中的在线学习，通过将创作者经济建模为用户、平台和内容创作者之间的三方博弈，分析并比较基于回报和基于特征两类契约，同时优化推荐策略，以期最大化效用。

Abstract

The creator economy has revolutionized the way individuals can profit through online platforms. In this paper, we initiate the study of online learning in the →

creator economy online learning recommender system principal-agent model contracts

发现论文，激发创造

在线推荐系统中激励高质量内容

本文研究了在线学习算法对内容创作者质量和创作动机的影响，发现 Hedge 和 EXP3 等算法会促进内容低质次，提出了一种基于惩罚低质次内容的算法以激励高质次的内容创作。

Jun, 2023

双边市场中用户和创作者的匹配问题

许多当前的在线平台，包括社交媒体网站，是连接内容创作者和用户的双边市场。本研究提出了一个内容推荐模型，明确关注用户与内容匹配的动态，并具有用户和创作者可能永久离开平台的新特性。我们展示了两种实用算法，在考虑双边离开的情况下，在总体参与度方面表现良好，相比于忽略双边离开的算法。

Dec, 2023

学习用户偏好以促进共享经济中的探索行为

通过向用户提供货币奖励来激励他们探索他们可能不会选择的选项是一种有效的方法，使用结构信息模型化为凸约束来学习合适的激励是最佳选择，我们提出了一种新颖的算法 - Coordinated Online Learning（CoOL）用于学习，我们通过测试 Airbnb 上公寓的数据来验证我们的方法是可行的，该方法有助于增加探索。

Nov, 2017

算法筛选平台上创作者激励建模

该研究探讨了内容创作者为获取用户关注所采取的策略，以及在线平台开发者所做出的算法选择对其影响，并提出了一种名为曝光博弈的模型来形式化这种动态。该模型证明了算法选择对曝光博弈的 Nash 均衡的存在和性质产生了重大影响，并提出了一种针对曝光游戏的 (前置) 审核工具来识别理想内容和以激励为导向的排名之间的不一致情况。

Jun, 2022

PPA-Game：在线内容创作者的竞争动态特征与学习

基于 Proportional Payoff Allocation Game 模型，分析代理者（类似于 YouTube 和 TikTok 上的内容创作者）为有限资源和用户关注度而竞争的情景，探讨纯纳什平衡是否存在，并采用多人多臂赌博机框架的在线学习算法来最大化每个代理者在一定轮次内的累积收益。

Mar, 2024

与学习代理人的契约

通过学习代理的重复合同，我们提供了一种动态合同的解决方案，这种合同对于知识有限的主体和代理都有利，并且可以应用于不同的时间范围。

Jan, 2024

网络合同设计的新视角：异质、同质、非近视代理人和团队生产

该论文主要研究了在线学习视角下的重复主体 - 代理问题，研究了当主体每轮与单个代理进行合同交互时的三种不同情境，并提出了不同的方法和技术来设计学习算法。此外，还研究了团队生产模型，并提出了一种有效找到最优合同的方法。

Mar, 2024

在线合同设计的样本复杂度

研究在线环境下的隐藏操作代理问题，介绍一种在线学习算法，提出一个关于 Stackelberg 遗憾的上界，并使用球形编码的覆盖数来限制契约设计的困难性和契约设计中的离散化误差，并提出解决方案，给出关于合同和行动空间的无限制上界。

Nov, 2022

契约强化学习：用无形之手牵引力量

通过合同设计解决在线学习问题中不同利益相关方的经济利益一致性，提出一种理论框架来解决机器学习中的代理问题，并设计了有效的动态规划算法和无悔学习算法以实现最优合同和平衡探索与开发的挑战。

Jul, 2024

推荐系统中的曝光限制学习

本文提出了一种上下文多臂赌博机模型来解决推荐系统中内容提供商对曝光量的依赖性，并开发具有次线性遗憾度和优化目标的算法，该算法的目标是最大程度地提高用户的福利和保留至关重要的内容提供商。

Feb, 2023