- 保序在线拍卖设计
基于预测区间的方法,提出了符合在线拍卖设计 (COAD),以量化竞标者价值的不确定性为基础,实现在线拍卖的最大化收益。COAD 结合了竞标者和物品特征,并利用历史数据提供一种激励兼容的机制。与传统在线拍卖方法不同,COAD 采用无分布、基于 - ICML广告竞拍中点击率预测的改进在线学习算法
我们研究了在线学习问题中的广告拍卖收入最大化问题,重点关注广告主的战略行为、点击率和动态估值对机制表现的影响。
- 互信息作为强化学习智能体的内在奖励:面向按需乘车拼车的研究
采用增强学习算法的车辆调度框架在提高收益的同时保证了请求的合理分配,可以显著提高现有最佳即时共乘方法的收入达到平均 3%的增长。
- 差分隐私在线商品定价
本次研究讨论如何在无限供应的物品定价拍卖中最大化收益并保护买家隐私,提出了一种新算法,提供了不同隐私保证的指数权重元算法,对于收益函数的间断问题进行了缓解,其结构类似于指数机制,适用于买家分阶段进行竞标的情况,具有次线性的遗憾率。
- SIGIR强化学习中的深度页面级兴趣网络用于广告分配
使用 Deep Page-level Interest Network (DPIN) 能够很好地建模用户的页级反馈和增加美团外卖平台的收入。
- 追求盈利:畅销且利润高的产品策略
本文提出了一个基于行为经济学的利润导向框架,计算出适用于定向营销的货架上受欢迎和最有利可图的产品,并提出了一种用于搜索 OPPP 及其变体的算法框架。
- 搜索与评分基于的瀑布式拍卖优化
本篇论文提出了一种方法,从历史数据中学习出最大化收益的水坑策略,实现了对估值分布和通过迭代搜索得分的候选瀑布流的匹配,与手动专家优化相比,方法改善了真实瀑布流的总收益。
- ICML学习针对移动目标进行定价
本文探讨在 Learning to Price 的环境下,当买家估值是一个移动目标的情况下,寻找一种使卖家能最大化收益的算法,并提供了对于最优收益损失的上下界限制。由于目标一直在移动,所以算法必须在探索和利用之间不断切换来保持最新的信息。
- 单参数收益最大化的样本复杂度解决
利用信息理论的方法,通过分析单参数收入最大化问题,对所有已考虑的数值分布族的样本复杂度进行了匹配的上下界的研究。
- 在线多尺度学习及其在网络拍卖中的应用
针对在线拍卖 / 定价问题的收益最大化问题,我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界,并且当与需要市场份额下限的基准进行比较时,可以获得几乎无尺度的遗憾界,同时满足离线样本复杂性。
- ICML保守型赌徒
研究一种新颖的多臂赌博问题,旨在解决公司在探索最大化收益新策略的同时,保持其收益在固定时间内持续增长的挑战。 通过提出自然而又新颖的策略来维护限制,我们在随机和对抗设置下分析了限制维护的代价。
- 展示财富:动态推荐以最大化收益
该论文通过建立推荐系统与企业盈利的新型连接,针对如何制定动态推荐策略,从而实现最大化收益的问题,提出了一种考虑价格、评估、饱和效应和产品之间竞争等多种因素的新模型,并利用基于 matroid 理论的精确连接以及智能启发式算法,对该模型进行了 - MM一种动态定价模型,用于统一程序化保证和实时竞价在展示广告中的应用
本文提出了一个数学模型,该模型分配和定价未来的广告展示 —— 既可以是通过实时竞价在拍卖市场上出售,也可以是通过保证合同事先出售。通过价格差异化和最优分配,该模型可将两种方式无缝地组合在一起,从而最大化发布者的收入。通过 RTB 数据评估, - 统一分布的拍卖的二重性和最优性
该研究提出了一个通用的二元性理论框架,用于在贝叶斯加法拍卖中实现收入最大化,应用线性规划的二元性和补充性到具有偏导数限制的约束中,将对偶系统用于推导最佳机制,并提出一种叫做 SJA 的确定性销售机制,经证明在最多 6 件物品的情况下是最优的 - NIPS具有战略买家的重复拍卖学习定价
我们研究了在线广告中的买方定价、多次交互和卖方算法,包括买方价值分布推断、策略性遗憾和卖方长期收入最大化。我们定义了策略性遗憾的自然概念,介绍了卖方算法,分析了买方的贴现能力。该文阐述了任何卖方算法在没有贴现时都将遭受线性策略性遗憾。
- 多维机制优化设计:将收益降至最小以实现福利最大化
本文提供了一个从收入最大化到福利最大化的规约,以在具有任意(可能是组合)可行性约束和具有任意(可能是组合)需求约束的多维贝叶斯拍卖中,恰当地将 Myerson 的结果扩展到此设置。我们还展示了每个可行的贝叶斯拍卖都可以实现为虚拟 VCG 分