- EcoRank: 使用大型语言模型的预算限制文本重新排序
利用 Large Language Models(LLMs)实现了文本重新排名,并通过预算约束方法中的预测策略、预算分配和 LLM APIs 的选择,提出了一种高效的文本重新排名方法 EcoRank,实验结果表明其优于其他预算感知的监督和非 - EERO: 早期退出与拒绝选项的有限预算高效分类
本研究提出了一种名为 EERO 的新方法,将早期退出的问题转化为使用具有拒绝选项的多个分类器的问题,以更好地选择每个实例的退出头。实验证明,该方法不仅有效管理预算分配,而且在超思考场景中提高了准确性。
- 警告标签不发两次:预算有限时,数量胜过质量的二元分类器比较
我们研究了如何在给定一个模糊标签的预算的情况下,比较两个二元分类器的准确性。我们证明了一个与常规智慧相悖的定理,即如果目标是确定两个分类器中的更好者,则在更多样本上收集单个标签是最好的。我们的结果是基于 Cramér 定理的非平凡应用得出的 - HiBid: 一个跨渠道约束竞价系统及预算分配的层次式离线深度强化学习
该研究提出了一种名为 HiBid 的层次离线深度强化学习框架,用于在线展示广告平台的交叉渠道受限出价及预算分配问题,并通过大规模日志数据和在线 A/B 测试验证了其在点击次数、CPC 满意度比率和投资回报率方面优于其他六种基准模型,并应用于 - WSDM离线约束深度强化学习中的营销预算分配
提出一种基于值函数的强化学习方法来解决在线营销活动中利用离线数据进行预算分配的问题,该方法通过使用混合策略减少存储策略的数量,并实现了接近最优策略的效率,经过大规模的营销活动实验证明该方法优于其他基准方法。
- 盲资源分配的随机直接搜索方法的遗憾分析
研究在预算分配中使用直接搜索方法,提出了一种改进的算法来加速梯度下降方向的识别,并将算法的累计遗憾度分析为 T 的 2/3 次方的上限。
- 领英广告市场中的竞标代理设计
本研究建立了一个通用的优化框架,用于设计动态在线市场中的自动竞价代理,该框架仅优化买家的利益,并对卖家施加的拍卖机制无动于衷,因此可以跨多个平台联合优化一组广告,并自动保证预算分配和出价策略的最优性。
- NIPS社区探索:从离线优化到在线学习
本文研究社区勘探问题,提出基于预算的勘探算法,并通过对线上和线下的优化研究,提出了一种新的上置信度算法,可在多轮探索中实现对社区规模的学习,并将不同轮次的反馈相结合以获得恒定的后悔值。
- 随机消防员问题
本文研究传染病动态传播的预防措施,以 Firefighter 问题为基础,提出了对感染节点附近的邻居进行疫苗接种的简单策略,并在树、网络图等模型上提出预算分配方案,实验证明该策略在现实网络中的有效性。
- AAAI信息最大化的 HodgeRank 算法用于众包排名聚合
研究了基于信息最大化的主动抽样策略,旨在智能地为任务请求者分配有限的预算,以提高标注质量和效率,经实验证明,该方法比传统的抽样方案表现更好,更适合于实际的众包实验。
- ICML众包场景下的动态任务分配
本文提出一种基于互信息解释的众包问题优化任务分配的方法,通过动态任务分配实现更高的准确度和可能需要更少的标签,从而提高了任务分配的效果。
- KDD基于多点触控归因的在线广告预算分配
该研究探讨了在线广告的预算分配问题,通过使用多种归因方法来确定子活动的表现,以最大化广告主或活动级别的投资回报率。
- 众包标注中的最优预算分配统计决策
本篇论文研究了众包标注中的预算分配问题,提出了一种基于贝叶斯马尔科夫决策过程的新算法,即乐观的知识梯度策略,该算法被证明在相同的预算水平下能够实现更高的标签准确性,实验结果表明了该算法在众包标注中的效果。