Jun, 2021

公平探索的公理谈判

TL;DR研究了在在线学习中探索成本如何跨越多个组之间分摊,并提出了一种“分组”赌博模型,利用公理谈判和纳什谈判解来形式化地划分探索成本,并通过创造性的方法推导了平衡公平和探索成本的策略。以华法林剂量的情境赌博为例说明了此算法框架的相对优点。