Aug, 2023

DF2: 分布无偏的决策导向学习

TL;DRDF2是第一个专门设计用于解决模型失配误差、样本平均近似误差和梯度近似误差的分布无关的决策导向学习方法。通过在训练过程中直接学习预期的优化函数,我们采用基于注意力机制的模型架构来高效地进行数据驱动型学习。我们在合成问题、风力发电竞标问题和非凸性疫苗分配问题上评估了DF2的有效性。