ICMLMay, 2023

具有强鲁棒性保证的边加权在线二分匹配学习

TL;DR本研究提出了一种基于强化学习的新型边权重在线二分图匹配方法(LOMAR),以实现良好的平均情况和最坏情况下的性能,其中,关键新颖的操作是根据谨慎的条件决定是否跟随专家的决策还是 RL 决策。