MADDM：最大化效用的多顾问动态二进制决策制定

May, 2023

MADDM：最大化效用的多顾问动态二进制决策制定

MADDM: Multi-Advisor Dynamic Binary Decision-Making by Maximizing the Utility

Zhaori Guo, Timothy J. Norman, Enrico H. Gerding

TL;DR提出一种新策略，在无先验知识的前提下，动态地选择可靠的顾问，通过多个顾问学习他们的可靠性，帮助做出最优的决策，以最大化整体效用。

Abstract

Being able to infer ground truth from the responses of multiple imperfect advisors is a problem of crucial importance in many decision-making applications, such as lending, trading, investment, and crowd-sourcing. In practice, however, gathering answers from a set of advisors has a cos

advisor selection decision-making reliability assessment sequential learning utility maximization

发现论文，激发创造

用对抗专家实现稳健的决策聚合

我们研究了一个关于二元决策聚合问题，其中既有真实可信的专家，又有对抗性的专家；我们的目标是设计一个稳健的聚合器来预测真实世界的状态，同时最小化与基准决策之间的预期损失差距。我们证明了在一些条件下，截断均值是最优的聚合器选择，并且很多情况下最优聚合器属于分段线性函数类；我们的结果表明，遗憾值与专家总数无关，只取决于对抗性专家的比例。

Mar, 2024

战略行为下的最优决策

研究表明，通过使用数据驱动的预测模型作出的决策越来越多，对于这些决策的影响，对于个人和社会，决策者透明公开的政策也就越来越重要。我们的研究目标是找到在具有策略性投资的情况下，对于实用性最优的决策策略，在我们的研究中，我们首先表征了个体策略性努力投资如何导致特征分布的变化，然后提出了一种适用于多种情况的最优决策策略的搜索方法，并根据合成和现实数据的实验结果，说明了我们算法找到的决策策略比没有考虑策略性的决策策略的实用性要高。

May, 2019

在高风险环境中指导人类学习

本文研究 AI 辅助决策的团队决策，在考虑决策者面临的协同成本、不完美的算法决策等限制条件下，研发了人工智能团队学习框架和 TeamRules 算法，可提供有针对性的决策建议并在处理协同成本和团队准确性之间的平衡上产生显著的效果

Oct, 2022

多准则决策问题的统一贝叶斯框架

该研究提出了基于概率解释的多准则决策制定中不同任务的贝叶斯框架，通过灵活的建模方法来解决群体决策问题和准则相关性等多方面的挑战，并可以适应决策者偏好的不确定性的不同形式。实验结果表明所提出的方法在多个数值示例中的效果并验证了其与其他方法相比的优势。

Aug, 2022

MORBDD：多目标受限二进制决策图的稀疏学习

通过机器学习方法，本研究使用二进制决策图在多准则决策中精确求解多目标整数线性规划问题，发现适用于单目标问题的局限二进制决策图可通过 ML 方法进行改进，产生具有优秀近似精度且规模较小的稀疏解。

Mar, 2024

利用 PDE 方法从两个依赖于历史的专家建议预测二进制序列

本文研究通过在线机器学习的技术，建立了一个 “股票预测问题” 的模型，探讨了投资者和市场策略，并使用最优控制、图论和偏微分方程的方法确定了使用两个与历史相关的专家的股票行情预测的性能上下界。

Jul, 2020

可配置镜像下降：决策制定的统一化

这篇论文旨在探索是否能开发一种单一算法以解决所有决策问题的分类。它通过引入广义镜像下降（GMD）、可配置镜像下降（CMD）和 GameBench 构建等方法来应对不同决策问题的挑战，并通过广泛的实验验证 CMD 在各个维度上对决策问题进行了具有竞争力的表现。

May, 2024

具备咨询能力的秘书

该论文讨论求职选择问题的模型 —— 秘书问题及其改进模型，提出一种基于线性规划的技术，探索在不同模型下优化算法的结构。

Nov, 2020

在线决策调解

提出了一种决策支持助手，用于在专家行为和人类行为之间充当中介；通过学习决策中介策略，并在顾及直接损失与未来泛化错误改进之间进行权衡，可以获得性能上的一致增益。

Oct, 2023

基于对决式波段自适应多源试验的抽取式问答

本文研究了基于用户反馈的多源测试时模型适应问题，采用随机决策过程来确定最佳适应模型。讨论了多臂匪类学习和多臂对决匪类学习两个框架，并用一种名为 Co-UCB 的新方法解决了多臂对决匪类学习任务。实验结果表明，Co-UCB 更有效。

Jun, 2023