创作者经济中的线上学习
本文研究了在线学习算法对内容创作者质量和创作动机的影响,发现 Hedge 和 EXP3 等算法会促进内容低质次,提出了一种基于惩罚低质次内容的算法以激励高质次的内容创作。
Jun, 2023
许多当前的在线平台,包括社交媒体网站,是连接内容创作者和用户的双边市场。本研究提出了一个内容推荐模型,明确关注用户与内容匹配的动态,并具有用户和创作者可能永久离开平台的新特性。我们展示了两种实用算法,在考虑双边离开的情况下,在总体参与度方面表现良好,相比于忽略双边离开的算法。
Dec, 2023
通过向用户提供货币奖励来激励他们探索他们可能不会选择的选项是一种有效的方法,使用结构信息模型化为凸约束来学习合适的激励是最佳选择,我们提出了一种新颖的算法 - Coordinated Online Learning(CoOL)用于学习,我们通过测试 Airbnb 上公寓的数据来验证我们的方法是可行的,该方法有助于增加探索。
Nov, 2017
该研究探讨了内容创作者为获取用户关注所采取的策略,以及在线平台开发者所做出的算法选择对其影响,并提出了一种名为曝光博弈的模型来形式化这种动态。该模型证明了算法选择对曝光博弈的 Nash 均衡的存在和性质产生了重大影响,并提出了一种针对曝光游戏的 (前置) 审核工具来识别理想内容和以激励为导向的排名之间的不一致情况。
Jun, 2022
基于 Proportional Payoff Allocation Game 模型,分析代理者(类似于 YouTube 和 TikTok 上的内容创作者)为有限资源和用户关注度而竞争的情景,探讨纯纳什平衡是否存在,并采用多人多臂赌博机框架的在线学习算法来最大化每个代理者在一定轮次内的累积收益。
Mar, 2024
该论文主要研究了在线学习视角下的重复主体 - 代理问题,研究了当主体每轮与单个代理进行合同交互时的三种不同情境,并提出了不同的方法和技术来设计学习算法。此外,还研究了团队生产模型,并提出了一种有效找到最优合同的方法。
Mar, 2024
研究在线环境下的隐藏操作代理问题,介绍一种在线学习算法,提出一个关于 Stackelberg 遗憾的上界,并使用球形编码的覆盖数来限制契约设计的困难性和契约设计中的离散化误差,并提出解决方案,给出关于合同和行动空间的无限制上界。
Nov, 2022
通过合同设计解决在线学习问题中不同利益相关方的经济利益一致性,提出一种理论框架来解决机器学习中的代理问题,并设计了有效的动态规划算法和无悔学习算法以实现最优合同和平衡探索与开发的挑战。
Jul, 2024
本文提出了一种上下文多臂赌博机模型来解决推荐系统中内容提供商对曝光量的依赖性,并开发具有次线性遗憾度和优化目标的算法,该算法的目标是最大程度地提高用户的福利和保留至关重要的内容提供商。
Feb, 2023