- 上下文动态定价与综合估值模型中的极小化最优性
通过可观察的产品特征和顾客特征,提出一种新算法,通过离散化未知噪声分布和上限置信区间与分层数据分区技术的组合,有效地调节每个周期中的懊悔,从而控制与定价决策相关的懊悔,实现极小极大优化。
- 理解预训练变压器在序贯决策中的训练和泛化
本文考虑了一类顺序决策问题的受监督预训练变压器模型,并且提出了一种解决预训练变压器训练及泛化问题的自然方法,该方法通过在训练过程中包含变压器生成的动作序列来提供更好的性能。同时,文章还分析了预训练变压器作为一种算法的特性,解释了其缺乏探索性 - 对不公平动态定价的公正激励
利用动态定价和人工智能方法来解决需求公平和税收再分配政策的问题,并通过模拟经济的实验验证了这种介入策略的潜在效果。
- 动态定价和长期参考效应的学习
在这篇研究论文中,我们研究了动态定价问题,其中客户对当前价格的反应受到客户的价格期望(参考价格)的影响。我们研究了一种简单而新颖的参考价格机制,其中参考价格是卖方过去所提供的价格的平均值。我们证明,在这种机制下,降价政策是近乎最优的,无论模 - 背景动态定价中的公平性与需求学习
本文介绍了一种新颖的上下文强化学习算法,用于在具有不确定需求的情况下,根据效用公平性约束进行个性化定价,实现最优的遗憾上限。我们的方法结合动态定价和需求学习,解决了定价策略中的公平性的关键挑战。我们通过数学分析和计算研究来表征受到公平性约束 - 平滑自适应非参数需求学习的动态定价
我们研究了需求函数为非参数化和 H"older 平滑的动态定价问题,重点关注对需求函数的未知 H"older 平滑参数 β 的可适应性。在没有 β 的知识的情况下,我们证明了没有定价策略能够达到这个极小化后悔的最佳性能。受到这个不可能结果的 - 参数化马尔可夫决策过程下的汤普森采样
本论文研究了参数化马尔可夫决策过程(Parameterized MDPs),使用贝叶斯推理学习其中的关键参数,提出了一组假设,对 Thompson 抽样算法保证了一个渐进最优的预期后悔边界(Asymptotically optimal ex - 贝叶斯劝服下的动态定价与学习
该研究探讨在线广告和动态定价设计的问题,使用贝叶斯说服模型来研究信号对买家定价和购买决策的影响,提出了一种具有低后悔率的在线算法。
- 动态定价中 n 人马尔可夫博弈的近似纳什均衡学习
本文研究了具有竞争性的马尔可夫游戏中的 Nash 均衡学习,使用了一种新的无模型方法找到近似 Nash 均衡,其中策略 - ε 对应性和状态至 ε- 最小策略是用神经网络表示的。在动态价格领域,可以学习到近似的 Nash 均衡。
- 基于知识图谱的半导体供应链定价模型
该论文提出了一种基于知识图谱的动态定价模型 KnowGraph-PM,利用客户档案和订单行为来确定相应的价格溢价,实现了客户量身定制的收益管理。
- AAAI在几何衰减动态环境中的决策依赖风险最小化
研究了基于体积衰减过程动态演变的决策者行动依赖数据分布下的最小化预期损失问题,提出了针对信息设置和损失函数的两种全新算法,经过实验验证可显著提高机构目标(目标占用)并降低停车费率。
- 隐私保护的动态个性化定价与需求学习
本文提出动态定价模型,以差分隐私保护个人信息并最大化利润,通过引入 anticipanting (ε, δ)- 差分隐私的概念,在个性化信息被对手攻击的情况下,实现了可接受的收益和隐私保护水平,保护了客户的个人信息,实现最大化的收益。
- 静态时间表下的动态定价(和组合)
本文研究了静态控制策略在动态定价和优化收入管理方面的应用,针对有限的库存,在平稳和非平稳需求下分别考虑了定价控制和分类控制,通过将先知不等式技术应用到定价和商品分类问题中,提出了一种简单的静态策略。该策略在不同需求模型下的保证具有一定的理论 - MM学习在非稳态下进行优化
介绍了一种新的非平稳线性随机赌博算法,应用于动态定价和广告分配领域,并使用滑动窗口 UCB 算法实现了最优动态后悔上界。
- 上下文决策的多维二进制搜索
构建了一个叫作 “Projected Volume” 的算法,它通过一个新的几何技术,将容积削减策略与 “圆柱化” 相结合,实现了在多维单位球内搜索状态向量并通过收到的方向猜测其中的夹角,从而优化了动态定价和个性化医疗等决策领域中的应用。
- 基于需求协变量的动态定价
研究了带有需求协变量的动态定价问题,证明了 GILS 取得了渐进最优表现,即使将没有信息的任何一组协变量包含在 GILS 中也能使其渐进最优。
- ICML有限随机部分监控的自适应算法
本文提出了一种新的随时算法,实现了对于有限的随机部分监测任何实例的近似最优遗憾,特别是对于 “容易” 和 “困难” 问题,该新算法在对数因子内实现了极小化遗憾。对于容易的问题,它还实现了对数个体遗憾。最重要的是,该算法在对手策略位于策略空间 - 有限供应下的动态定价
考虑具有有限供应的动态定价问题,研究非依赖事先信息的机制,与依赖事先信息的机制进行对比分析,最终利用多臂老虎机方法提出了可行的动态定价机制,该机制的收益与离线基准相差最多 O ((k log n)^(2/3)),在 k/n 足够小的情况下,