基于显式偏好的在线学习和利润最大化
本文探讨了如何从单调偏好数据中学习效用函数,提供了用于多种重要类别的样本复杂度保证和有效算法,并使用最近多类学习的进展和有关线性价格模型的紧密联系,提出了一种解决线性效用函数学习问题的高效算法。(Sample complexity guarantees and efficient algorithms are provided for learning utility function from revealed preference data, and a computationally efficient algorithm with tight sample complexity guarantees is proposed for learning linear utility functions under a linear price model).
Jul, 2014
研究在线线性分类问题,应对操纵特征的策略代理的对抗性选择和他们操纵向量的揭示偏好,提供一个计算有效的学习算法,获得减小的 Stackelberg 后悔以近似于最佳分类器。
Oct, 2017
本文提出通过揭示意向方法,解决了在 follower 效用函数未知的 Stackelberg 博弈中求解 leader 最优策略的问题,并在包括利润最大化和非原子性拥塞博弈最优通行费率问题在内的广泛问题上表现良好。
Apr, 2015
该论文研究了在重复多单位拍卖中基于均匀定价的两个变体,并分析了在线和离线设置下的问题。作者提出了离线最优策略算法,并设计了高效的在线算法,同时通过博弈理论探究了平衡的质量。
May, 2023
本研究提出了一种基于偏好学习方法的离线学习效用函数的优化算法,不仅可以使用关于结果的偏好,还可以使用效用函数空间的粗略信息,尤其在使用很少的结果时有助于提高效用函数的估计精度,并且可以结合模型来考虑效用函数学习任务中发生的不确定性。
Aug, 2022
通过在在线学习框架中的交易者之间进行经纪,我们研究了经纪的关键问题。我们探索了经纪机构如何最大限度地提高交易量,并分析了对于交易者来说最优的交易策略和遗憾率。
May, 2024