May, 2023

MADDM:最大化效用的多顾问动态二进制决策制定

TL;DR提出一种新策略,在无先验知识的前提下,动态地选择可靠的顾问,通过多个顾问学习他们的可靠性,帮助做出最优的决策,以最大化整体效用。